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(57) Abstract 

The present invention relates to regulatory DNA sequences containing promoter sequences, in addition to intervening sequences, for 
the human catalytic teiomerase sub-unit gene. The invention also relates to the use of said DNA sequences for pharmaceutical, diagnostic 
and therapeutic purposes, especially in the treatment of cancer and ageing. 



(57) Zusammenfassung 

Diesc Erfindung bctrifft regulatorische DNA-Scquenzcn, bcinhaltend Promotorsequenzen, sowic Intronsequenzen, fQr das Gen der 
humanen kalytischen Telomerase-Untcreinheit Daruber hinaus betrifft diesc Erfindung die Verwendung dieser DNA-Sequenzen ftlr 
pharrnazeutische, diagnostische und therapeutische Zwecke, vor aliem in der Behandlung von Krebs und Alterung. 
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Regulatorische DNA-Sequenzen des Gens der humanen kataiytischen 
Tdomerase-Untereinheit und deren diagnostische und therapeutische Verwen- 
dung 

5 Aufbau und Funktioa der Chromosomenenden 

Das genetische Material eukaryontischer ZeLlen ist auf linearen Chromosomen 
verteilt. Die Enden der Erbanlagen werden, abgeleitet von den griechischen Wfirtern 
telos (Ende) und meros (Teil, Segment), als Telomere bezeichnet. Die meisten 
1 0 Telomere bestehen aus Wiederholungen von kurzen Sequenzen, die iiberwiegend aus 
Thymin und Guanin aufgebaut sind (Zakian, 1995). In alien bisiang untersuchten 
Wirbeltieren werden die Telomere aus der Sequenz TTAGGG aufgebaut (Meyne et 
ai % 1989). 

15 Die Telomere uben verschiedene wichtige Funktionen aus. Sie verhindern die Fusion 
von Chromosomen (McCIintock, 1941) und damit die Entstehung von dizentrischen 
Erbanlagen. Solche Chromosomen mit zwei Centromeren konnen durch Verlust der 
Heterozygotie bzw. Verdopplung oder Verlust von Genen zur Entwicklung von 
Krebs fuhren. 

20 

Desweiteren dienen Telomere dazu, intakte Erbanlagen von beschadigten zu unter- 
scheiden. So steiiten Hefezellen ihre Zellteilung ein, wenn sie ein Chromosom ohne 
Telomer enthielten (Sandell und Zakian, 1993). 

25 Eine weitere wichtige Aufgabe erfiiilen Telomere bei der DNA-Replikation 
eukaryontischer Zellen. Im Gegensatz zu den zirkulaxen Genomen von Prokaryonten 
konnen die linearen Chromosomen der Eukaryonten von dem DNA Polymerase- 
Komplex nicht voilstandig repliziert werden. Zur Initiation der DNA-Replikation 
sind RNA-Primer notwendig. Nach Abspaltung der RNA-Primer, Verlangerung der 

30 Okazaki-Fragmente und anschlieBender Ligation fehlt dem neu-synthetisierten DNA- 
Strang das 5'-Ende, denn dort kann der RNA-Primer nicht durch DNA ersetzt 
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werden. Ohne besondere Schutzmechanismen wiirden daher die Chromosomen mit 
jeder Zellteilung schrumpfen ("end-replication problem"; Harley et aL, 1990). Die 
nicht-kodierenden Telomersequenzen stelien vermutlich eine Pufferzone dar, um 
dem Verlust von Genen vorzubeugen (Sandell und Zakian, 1993). 

Daruberhinaus spielen Telomere auch eine wichtige Rolle bei der Regulation der zel- 
lularen Alterung (Olovnikov, 1973). Humane somatische Zellen zeigen in Kultur 
eine limitierte Replikationskapazit£t; sie werden nach einer gewissen Zeit seneszent. 
In diesem Zustand teilen sich die Zellen selbst nach Stimulierung mit Wachstumsfak- 
toren nicht mehr, sterben aber nicht, sondern bleiben metabolisch aktiv (Goldstein, 
1990). Verschiedene Beobachtungen sprechen fur die Hypothese, dafl eine Zelle an- 
hand der Lange ihrer Telomere bestimmt, wie oft sie sich noch teiien kann (Allsopp 
et o/., 1992). 

Zusammenfassend besitzen die Telomere somit zentrale Funktionen bei der Alterung 
von Zellen sowie der Stabilisierung des genetischen Materials und Verhinderung von 
Krebs. 

Das Enzym Telomerase synthetisiert die Telomere 

Wie oben beschrieben konnen Organismen mit linearen Chromosomen ohne etnen 
speziellen Schutzmechanismus ihr Genom nur unvollst&ndig replizieren. Die meisten 
Eukaryonten verwenden zur Regeneration der Telomersequenzen ein spezielles En- 
zym, die Telomerase. In den bislang untersuchten Einzellern wird Telomerase konsti- 
tutiv exprimiert. Dagegen wurde in Menschen die Telomerase-Aktivitat nur in Keim- 
zellen und Tumorzellen gemessen, wogegen benachbartes somatisches Gewebe keine 
Telomerase enthielt (Kim et a/., 1994). 

Funktionell kann die Telomerase auch als terminale Telomertransferase bezeichnet 
werden, die als Multiproteinkomplex im Zellkern lokalisiert ist. Wahrend der RNA- 
Anteil der humanen Telomerase schon seit langerem bekannt ist (Feng et a/., 1995), 
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wurde kiirzlich die katalytische Untereinheit dieser Enzymgruppe in verschiedenen 
Organismen identifiziert (Lingner et aL, 1997; vgl. unsere ebenfalls anhangige 
Anmeldung PCT EP/98/03468). Diese katalytischen Untereinheiten der Telomerase 
sind sowohl untereinander als auch zu bisher alien bekannten reversen Transkriptasen 
5 auffaliig homolog. 

Auch in WO 98/14592 werden NukleinsSure- und Amino sauresequenzen der 
katalytischen Telomerase-Untereinheit beschrieben. 

10 Aktivierung der Telomerase in menschlichen Tumoren 

Eine Aktivitat der Telomerase konnte in Menschen ursprunglich nur in Keimbahnzel- 
len, nicht aber in normalen somatischen Zellen (Hastie et aL, 1990; Kim et aL, 1994) 
nachgevviesen werden. Nach der Entwicklung eines sensitiveren Nachweisverfahrens 

15 (Kim et aL, 1994) wurde auch in hematopoietischen Zellen eine geringe Telomerase- 
aktivitat detektiert (Broccoli et aL, 1995; Counter et aL, 1995; Hiyama et aL, 1995). 
Allerdings wiesen diese Zellen trotzdem eine Reduktion der Telomere auf (Vaziri et 
aL, 1994; Counter et aL, 1995). Noch ist nicht geklart, ob die Menge an Enzym in 
diesen Zellen nicht ausreichend fur eine Kompensation des Telomerverlustes ist, oder 

20 ob die gemessene Telomerase-Aktivitat von einer Subpopulation, z.B. unvollstandig 
ausdifferenzierten CD34 + 38 + -Vorlauferzellen, herriihrt (Hiyama et aL, 1995). Zur 
Klarung ware ein Nachweis der Telomerase- Aktivi tat in einer einzelnen Zelle n6tig. 

Interessanterweise wurde jedoch in einer groBen Zahl der bislang getesteten Tumor- 
25 gewebe eine signifikante Telomerase-Aktivitat nachgewiesen (1734/2031, 85 %; 
Shay, 1997), wahrend in normalem somatischen Gewebe keine Aktivi tat gefunden 
wurde (1/196, <1 %, Shay, 1997). Verschiedene Untersuchungen zeigten aufierdem, 
daB in seneszenten Zellen, die mit viralen Oncoproteinen transformiert wurden, die 
Telomere weiterhin schrumpften und Telomerase nur in der Subpopulation entdeckt 
30 werden konnte, die die Wachstumskrise Uberlebte (Counter et aL, 1992). In diesen 
immortalisierten Zellen waren auch die Telomere stabil (Counter et aL, 1992). Ahnli- 
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che Befunde aus Untersuchungen an Mausen (Blasco et aL, 1996) stutzen die An- 
nahme, daB eine Reaktivierung der Telomerase ein spMtes Ereignis in der Tumorge- 
nese ist. 

Basierend auf diesen Ergebnissen wurde eine "Telomerase-Hypothese" entwickelt, 
die den Verlust von Telomersequenzen und Zellalterung mit der Aktivitat von 
Telomerase und der Entstehung von Krebs verbindet. In langlebigen Spezies wie 
dem Menschen kann das Schrumpfen der Telomere als ein Mechanismus zur Tumor- 
suppression angesehen vverden. Ausdifferenzierte Zellen, die keine Telomerase 
enthalten, steilen bei einer bestimmten Lange der Telomere ihre Zellteilung ein. 
Mutiert eine solche Zelle, so kann aus ilxr nur dann ein Tumor entstehen. wenn die 
Zeile ihre Telomere verlangern kann. Ansonsten vviirde die Zelle weiterhin Telomer- 
sequenzen verlieren, bis ihre Chromosomen instabil vverden und sie schliefllich zu- 
grunde geht. Die Reaktivierung der Telomerase ist vermutlich der Hauptmechanis- 
mus von Tumorzellen zur Stabilisation ihrer Telomere. 

Aus diesen Beobachtungen und Uberiegungen ergibt sich, dafi eine Inhibition der Te- 
lomerase eine Therapie von Tumoren erlauben sollte. Konventionelle Krebstherapien 
mit Zytostatika oder kurzwelligen Strahlen schadigen nicht nur die Tumorzellen, 
sondern alle sich teilenden Zellen des Korpers. Da aber auBer Tumorzellen nur 
Keimbahnzellen eine signifikante Telomerase-Aktivitat enthalten. wurden Telome- 
rase-Inhibitoren spezifischer die Tumorzellen angreifen und somit weniger uner- 
vvunschte Nebenwirkungen hervorrufen. In alien bislang getesteten Tumorgeweben 
wurde eine Telomerase-Aktivitat nachgewiesen, so dafi diese Therapeutika gegen alle 
Krebsarten eingesetzt werden konnten. Die Wirkung von Telomerase-Inhibitoren 
wiirde dann eintreten, wenn die Telomere der Zellen sich soweit verktirzt haben, daft 
das Genom instabil wird. Da Tumorzellen meist kiirzere Telomere aufweisen als 
normale somatische Zellen, wurden zuerst Krebszellen durch Telomerase-Inhibitoren 
eliminiert werden. Zellen mit langen Telomeren, wie die Keimzellen, vvtirden 
dagegen erst viel spater geschadigt werden. Telomerase-Inhibitoren steilen somit 
einen zukunftsweisenden Weg fur die Therapierung von Krebs dar. 
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Eindeutige Antworten auf die Frage nach der Art und den Angriffspunkten physiolo- 
gischer Telomerase-Inhibitoren werden mSglich sein, wenn auch die Regulation der 
Genexpression der Telomerase identifiziert ist. 

5 

Regulation der Genexpression in Eukaryonten 

Die eukaryotische Genexpression, d.h. der zellulare Informationsflufi von der DNA 
uber die RNA zum Protein, weist vielfMltige Ansatzpunkte fur regulatorische Mecha- 
10 nismen auf. Einzelne Kontrollstufen sind 2.B. die Gen-Amplifikation, Rekombina- 
tion von Genloci, Chromatinstruktur, DNA-Methylierung, Transkription, posttrans- 
kriptionelle mRNA-Modifikationen, mRNA-Transport, Translation und post-trans- 
lationale Proteinmodifikationen. Nach bisherigen Studien besitzt die Kontrolle auf 
der Ebene der Transkriptionsinitiation die groBte Bedeutung (Latchman, 1991). 

15 

Unmitteibar stromaurwarts vom Transkriptionsstart eines von der RNA-Polymerase 
II transkribierten Gens liegt eine Region, die fur die Steuerung der Transkription ver- 
antwortlich ist und als Promotorregion bezeichnet wird. Ein Vergieich der Nukleo- 
tidsequenzen von Promotorregionen vieler bekannter Gene zeigt, daB bestimmte 

20 Sequenzmotive in dieser Region haufig vorkommen. Zu diesen Elementen gehoren 
unter anderem die TATA-Box, die CCAAT-Box und die GC-Box, die von spezifi- 
schen Proteinen erkannt werden. Die TATA-Box, die etwa 30 Nukleotide stromauf- 
w&rts vom Transkriptionsstart entfernt positioniert ist, wird z.B. von der TFIID- 
Untereinheit TBP („TATA-box binding protein") erkannt, wogegen bestimmte GC- 

25 reiche Sequenzabschnitte vom Transkriptionsfaktor Spl („specificity protein 1") spe- 
zifisch gebunden werden. 

Funktionell kann man den Promotor in einen regulativen und einen konstitutiven Ab- 
schnitt unterteilen (Latchman, 1991). Der konstitutive Kontrollbereich umfaBt den 
30 sogenannten Kernpromotor („corepromoter u ), der die korrekte Initiation der Trans- 
kription ermoglicht. Er enthait die als UPE's (upstream promoter elements") be- 
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schriebenen Sequenzelemente, die fur eine effiziente Transkription notwendig sind. 
Die regulativen Kontrollabschnitte, die mit den UPE's verflochten sein konnen, 
weisen Sequenzelemente auf, die an der signalabh&igigen Regulation der Trans- 
kription durch Hormone, Wachstumsfaktoren usw. beteiligt sein konnen. Sie ver- 
5 mitteln gewebs- oder zellspezifische Promotoreigenschaften. 

Ein charakteristisches Merkmal eukaryotischer Gene sind DNA-Abschnitte, die uber 
vergleichsweise groBe Distanzen hinweg EinfluB auf die Genexpression nehmen kon- 
nen. Diese Elemente konnen stromaufwarts, stromabw&rts oder innerhalb einer 
10 Transkriptionseinheit lokalisiert sein und unabhangig von ihrer Orientierung ihre 
Funktion' wahrnehmen. Diese Sequenzabschnitte konnen die Promotoraktivitat ver- 
starken (Enhancer) oder abschwMchen (Silencer). Ahnlich wie die Promotorregionen 
beherbergen auch Enhancer und Silencer mehrere Bindungsstellen fur Transkrip- 
tionsfaktoren. 

15 

Die Erfindung betrifft die DNA-Sequenzen aus der 5'-flankierenden Region des 
Gens der katalytisch aktiven humanen Telomerase-Untereinheit sowie Intron- 
Sequenzen fur dieses Gen. 

20 Die Erfindung betrifft insbesondere die 5'-flankierende regulatorische DNA- 
Sequenz, enthaltend die Promotor-DNA-Sequenz fur das Gen der humanen 
katalytischen Telomerase Untereinheit gemafl Fig. 10 (SEQ ID NO 3). 

Die Erfindung betrifft weiterhin regulatorisch wirksame Teilbereiche der 5'-flankie- 
25 renden regulatorischen DNA-Sequenz gemaD Fig. 4 (SEQ ID NO 1 ). 

Weiterhin sind Gegenstand der vorliegenden Erfindung Intron-Sequenzen fur das 
Gen der humanen katalytischen Telomerase-Untereinheit, insbesondere soiche, die 
regulatorische Wirkung haben. Die erfindungsgem£fien Intronsequenzen werden im 
30 Rahmen von Beispiel 5 detailliert beschrieben (vgl. SEQ ID NO 4, 5, 6, 7, 8, 9, 10, 
11, 12, 13, 14, 15, 16, 17, 18, 19 und 20). 
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Die Erfindung betrifft weiterhin ein rekombinantes Konstrukt, das die erfindungsge- 
maflen DNA-Sequenzen, insbesondere die 5 '-flankierende DNA-Sequenz des Gens 
der humanen katalytischen Teiomerase Untereinheit oder Teilbereiche davon 
5 beinhaltet. 

Bevorzugt sind rekombinante Konstrukte, die neben den erfindungsgemaBen DNA- 
Sequenzen, insbesondere der 5'-flankierenden DNA-Sequenz des Gens der humanen 
katalytischen Teiomerase Untereinheit oder Teilbereichen davon, eine oder mehrere 
1 0 weitere DNA-Sequenzen, die fur Polypeptide oder Proteine kodieren, enthalten. 

GemaB einer besonders bevorzugten Ausfuhrungsform kodieren diese weiteren 
DNA-Sequenzen flir antitumorale Proteine. 

15 Besonders bevorzugte antitumorale Proteine sind solche, die die Angiogenese direkt 
oder indirekt inhibieren. Zu diesen Proteinen zahlen beispielsweise: 

Plasminogenaktivatorinhibitor (PAI-1), PAI-2, PAI-3, Angiostatin, Endostatin, 
Platelet factor 4, TIMP-1, TIMP-2, TIMP-3, Leukemia Inhibitory Factor (LIF). 

20 

Ebenfalls besonders bevorzugt sind antitumorale Proteine, welche direkt oder 
indirekt eine zytostatische Wirkung auf Tumoren aufweisen. Hierzu zahlen im 
besonderen: 

25 Perforin, Granzym, IL-2, IL-4, IL-12, Interferone, wie beispielsweise I FN -a, IFN-G, 
IFN-y, TNF, TNF-a, TNF-B, Oncostatin M; Tumors uppressorgene, wie z.B. p53, 
Retinoblastoma. 

Weiterhin besonders bevorzugt sind antitumorale Proteine, weiche gegebenenfalls 
30 zusatzlich zur antitumoraien Wirkung EntzUndungen stimulieren und hierdurch zur 
Elimination von Tumorzellen beitragen. Hierzu zahlen beispielsweise: 
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RANTES, Monocyte chemotactic and activating factor (MCAF), IL-8, Macrophage 
inflammatory protein (MIP-la,-B), Neutrophil activating protein-2 (NAP-2), IL-3, 
IL-5, human leukemia inhibitory factor (LIF), IL-7, IL-11, IL-13, GM-CSF, G-CSF, 
5 M-CSF. 

Weiterhin besonders bevorzugt sind antitumorale Proteine, welche aufgrund ihrer 
Wirkung als Enzyme in der Lage sind, Vorstufen eines antitumoralen Wirkstoffes in 
einen antitumoralen Wirkstoff zu uberfuhren. Zu diesen Enzymen zahlen beispiels- 
10 vveise: 

Herpes Simplex Virus Thymidinkinase, Varizella Zoster Virus Thymidinkinase, bak- 
terielle Nitroreductase, bakterielle B- Glukuronidase, pflanziiche B-Glukuronidase 
aus Secale careale, humane Glukuronidase, humane Carboxypeptidase, bakterielle 
1 5 Carboxypeptidase, bakterielle fl-Lactamase, bakterielle Cy tosindeaminidase, humane 
Katalase bzw. Phosphatase, humane alkalische Phosphatase, Typ 5 saure Phospha- 
tase, humane Lysooxidase, humane saure D-Aminooxidase, humane Glutathion 
Peroxidase, humane Eosinophiien Peroxidase, humane Schilddrusen Peroxidase. 

20 Die obengenannten rekombinanten Konstrukte konnen auch DNA-Sequenzen enthal- 
ten, die fur Faktor VIII, IX oder Teilfragmente davon kodieren. Zu diesen DNA- 
Sequenzen zahlen auch andere Blutgerinnungsfaktoren 

Die obengenannten rekombinanten Konstrukte konnen auch DNA-Sequenzen enthal- 
25 ten, die fiir ein Reporterprotein kodieren. Zu diesen Reporterproteinen zalilen bei- 
spielsweise: 

Chloramphenicoiacetyltransferase (CAT), Gluhwiirmchen Luziferase (LUC), B- 
Galaktosidase (B-Gal), Sezernierte alkalische Phosphatase (SEAP), Humanes 
30 Wachstumshormon (hGH), B-Glukuronidase (GUS), Griin-fluoreszierendes Protein 
(GFP) und alle davon abgeleiteten Varianten, Aquarin, Obelin. 
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ErfindungsgerMBe rekombinante Konstrukte konnen auch DNA kodierend fur die 
humane kataiytische Telomerase Untereinheit und deren Varianten und Fragmente in 
antisense Orientierung enthaiten. Gegebenenfalls konnen diese Konstrukte auch 
andere Protein-Untereinheiten der humanen Telomerase und die Telomerase-RNA- 
Komponente in antisense Orientierung enthaiten. 

Die rekombinanten Konstrukte konnen neben der DNA, kodierend fur die humane 
kataiytische Telomerase Untereinheit, sowie deren Varianten und Fragmente auch 
andere Protein-Untereinheiten der humanen Telomerase und die Telomerase-RNA- 
Komponente enthaiten. 

Die Erfindung betrifft weiterhin einen Vektor, enthaltend die oben genannten erfin- 
dungsgemafien DNA-Sequenzen, insbesondere die 5'-flankierenden DNA-Sequen- 
zen, sowie eine oder mehrere der oben genannten anderen DNA-Sequenzen. 

Bevorzugter Vektor fur solche Konstrukte ist ein Virus, beispielsweise ein Retrovi- 
rus, Adenovirus, adeno-assoziiertes Virus, Herpes Simplex Virus, Vaccina Virus, 
lentivirales Virus, Sindbis Virus und ein Semliki Forest Virus. 

Ebenfalls bevorzugt sind Plasmide als Vektoren. 

Die Erfindung betrifft weiterhin pharmazeutische Praparate, enthaltend erfin- 
dungsgema&e rekombinante Konstrukte bzw. Vektoren; beispielsweise eine Zube- 
reitung in einem kolloidalen Dispersionssystem. 

Geeignete kolloidale Dispersionssysteme sind beispielsweise Liposome oder Polyly- 
sin-Liganden. 

Die Zubereitungen der erfindungsgemaBen Konstrukte bzw. Vektoren in kolloidalen 
Dispersionssystemen kfinnen um einen Liganden erganzt sein, der an Membranstruk- 
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turen von Tumorzellen bindet. Ein solcher Ligand kann z.B. an das Konstrukt bzw. 
den Vektor angekniipft sein oder auch Bestandteil der Liposomenstruktur sein. 

Geeignete Liganden sind insbesondere polyklonale oder monoklonale Antikorper 
5 oder Antikdrperfragmente hiervon, die mit ihren variablen Domanen an Membran- 
strukturen von Tumorzellen binden, oder endstandige Mannose-tragende Substanzen, 
Zytokine, Wachstumsfaktoren oder Fragmente bzw. Teilsequenzen hiervon, die an 
Rezeptoren auf Tumorzellen binden. 

10 Entsprechende Membranstrukturen sind beispielsweise Rezeptoren fur ein Zytokin 
oder einen Wachstumsfaktor, wie z.B. IL-1, EGF, PDGF, VEGF, TGF B, Insulin 
oder Insulin-like Growth Factor (ILGF), oder Adhasionsmolekiile, wie z. B. SLeX, 
LFA-1, MAC- 1, LECAM-1 oder VLA-4, oder der Mannose-6-Phosphat-Rezeptor. 

15 Zur vorliegenden Erfindung gehoren pharmazeutische Zubereitungen, die neben den 
erfindungsgemaBen Vektorkonstrukten auch nichttoxische, inerte, pharmazeutisch 
geeignete Tragerstoffe enthalten konnen. Vorstellbar sind die Applikation (z.B. intra- 
venos, intraarteriell, intramuskular, subkutan, intradermal, anal, vaginal, nasal, trans- 
dermal, intraperitonal, als Aerosol oder oral) am Ort eines Tumors oder die syste- 

20 mische Applikation dieser Zubereitungen. 

Die erfindungsgemaBen Vektorkonstrukte konnen in der Gentherapie eingesetzt wer- 
den. 

25 Die Erfindung betrifft weiterhin eine rekombinante Wirtszelle, insbesondere eine 
rekombinante eukaryotische Wirtszelle, enthaltend die vorstehend beschriebenen 
Konstrukte bzw. Vektoren. 

Die Erfindung betrifft weiterhin ein Verfahren zur Identiftzierung von Substanzen, 
30 die die Promoter-, Silencer- oder EnhanceraktivitMt der katalytischen Telomerase 
Untereinheit beeinflussen, wobei dieses Verfahren folgende Schritte umfaftt: 
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A. Zugabe einer Kandidatensubstanz zu einer Wirtszelle, enthaltend die 
erflndungsgemaBe regulatorische DNA-Sequenz, insbesondere die 5'-flankie- 
rende regulatorische DNA-Sequenz fur das Gen der humanen katalytischen 

5 Telomerase-Untereinheit oder einen regulatorisch wirksamen Teilbereich 

davon, funktionell verknupft mit einem Reportergen, 

B. Messung des Substanzeffektes auf die Reportergenexpression. 

10 Das Verfahren kann eingesetzt werden zur Identifizierung von Substanzen, die die 
Promotor-, Silencer- oder Enhanceraktivitat der katalytischen Telomerase Unterein- 
heit verstarken. 

Das Verfahren kann weiterhin eingesetzt werden zur Identifizierung von Substanzen, 
15 die die Promotor-, Silencer- oder Enhanceraktivitat der katalytischen Telomerase 
Untereinheit inhibieren. 

Die Erfindung betrifft weiterhin ein Verfahren zur Identifizierung von Faktoren, die 
spezifisch an Fragmente der erfmdungsgem&Ben DNA-Fragmente, insbesondere der 
20 5'-flankierenden regulatorischen DNA-Sequenz der katalytischen Telomerase 
Untereinheit, binden. Diese Methode beinhaltet ein Screening einer Expressions- 
cDNA-Bibliothek mit der vorstehend beschriebenen DNA-Sequenz oder Teilfrag- 
menten unterschiediichster Lange als Sonde. 

25 Die vorstehend beschriebenen Konstrukte bzw. Vektoren kfinnen auch zur Her- 
stellung transgener Tiere verwendet werden. 

Die Erfindung betrifft weiterhin ein Verfahren zur Detektion Teiomerase-assoziierter 
Zustande bei einem Patienten, das folgende Schritte umfaBt: 



30 
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A. Inkubation eines Konstruktes bzw. Vektors, enthaltend die erflndungsgemaBe 
DNA-Sequenz, insbesondere die S'-flankierende regulatorische DNA- 
Sequenz fiir das Gen der humanen katalytischen Telomerase-Untereinheit 
oder einen regulatorisch wirksamen Teilbereich davon sowie ein Reportergen 
mit KSrperfliissigkeiten oder zellularen Proben, 

B. Detektion der Reportergenaktivitat, um einen diagnostischen Wert zu 
erhalten; 

C. Vergleich des diagnostischen Werts mit Standardwerten fiir das Reportergen- 
konstrukt in standardisierten normalen Zellen oder Korperflussigkeiten des 
gieichen Typs wie die Testprobe; 

Detektion diagnostischer Werte, die h6her oder niedriger ais Standardvergleichswerte 
liegen, indiziert einen Telomerase-assoziierten Zustand, der wiederum einen pathoge- 
nen Zustand indiziert. 

Erlauterung der Abbildungen: 

Fig. 1 : Southern Blot-Analyse mit genomischer DNA verschiedener Spezies 

A: Foto eines Ethidiumbromid gefarbten 0,7 %igen Agarosegels mit etwa 
4 ^ig Eco RI geschnittener genomischer DNA. Die Spur 1 enthalt Hind III 
geschnittene X-DNA als GroBenmarker (23,5, 9,4, 6,7, 4,4, 2,3, 2,0, und 
0,6 kb). Die Spuren 2 bis 10 enthalten genomische DNA von Mensch, 
Rhesusaffe, Spraque Dawley Ratte, BALB/c Maus, Hund, Rind, 
Kaninchen, Huhn und Hefe (Saccharomyces cerevisiae). 

B: Zu Fig. 1 A korrespondierendes Autoradiogramm einer Southern Blot- 
Analyse, hybridisiert mit einer radioaktiv-markierten etwa 720 bp langen 
hTC-cDNA Sonde. 
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Fig. 2: Restriktionsanalyse der rekombinanten X-DNA des Phagenklons P12, der 
mit einer Sonde aus dem 5'-Bereich der hTC-cDNA hybridisiert. 



5 Die Abbildung zeigt ein Foto eines Ethidiumbromid gefarbten 0,4 %igen 

Agarosegels. Die Spuren 1 und 2 enthalten Eco RI/Hind III geschnittene 
X.-DNA bzw eine I kb Letter der Firma Gibco als Groflenmarker. Die 
Spuren 3 - 7 enhalten 250 ng mit Bam HI (Spur 3), Eco RI (Spur 4), Sal I 
(Spur 5), Xho I (Spur 6) und Sac I (Spur 7) geschnittene DNA des 

10 rekombinanten Phagens. Die Pfeile kennzeichnen die zwei X-Arme des 

Vektors EMBL3 Sp6/T7. 



Fig. 3: Restriktionsanalyse und Southern Blot-Analyse der rekombinanten X- 
DNA des Phagenklons, der mit einer Sonde aus dem 5'-Bereich der hTC- 
1 5 cDN A hybridisiert. 



A: Die Abbildung zeigt ein Foto eines Ethidiumbromid gefarbten 
0,8%igen Agarosegels. Die Spuren I und 1 5 enthalten eine 1 kb Leiter 
der Firma Gibco als Groflenmarker, Die Spuren 2 bis 14 enthalten 250 ng 

20 geschnittene X.-DNA vom rekombinanten Phagenklon. Als Enzyme 

wurden eingesetzt: Spur 2: Sac I, Spur 3: Xho I, Spur 4: Xho I, Xba I, 
Spur 5: Sac I, Xho I, Spur 6: Sal I, Xho I, Xba I, Spur 7: Sac I, Xho I, 
Xba I, Spur 8: Sac I, Sal I, Xba I, Spur 9: Sac I, Sal I, BamH I, Spur 10: 
Sac I, Sal I, Xho I, Spur 11: Not I, Spur 12: Sma I, Spur 13: leer, Spur 

25 14: nicht verdaut. 



B: Zu Fig.3 A korrespondierendes Autoradiogramm einer Southern Blot- 
Analyse. Als Sonde fvir die Hybridisierung wurde ein etwa 420 bp langes 
5'-hTC-cDNA Fragment eingesetzt. 



30 
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Fig. 4: Partieile DNA-Sequenz der 5'-flankierenden Region und des Promoters 
vom Gen der humanen katalytischen Telomerase-Untereinheit. Das 
ATG-Startcodon ist in der Sequenz fett hervorgehoben. Die dargestellte 
Sequenz entspricht SEQ ID NO 1. 

5 

Fig. 5: Identifizierung des Transkriptionsstarts durch Primer Extension- Analyse. 

Die Abbildung zeigt ein Autoradiogramm eines denaturierenden Poly- 
acrylamidgels, welches zur Darstellung einer Primer Extension-Analyse 

10 gew&hlt vvurde. Als Primer \vurde ein Oligonukleotid mit der Sequenz 

5'GTTAAGTTGTAGCTTACACTGGTTCTC 3' benutzt. In der Spur 1 
wurde die Primer Extension Reaktion aufgetragen. Die Spuren G, A, T, 
C, stellen die Sequenzreaktionen mit dem gleichen Primer und den ent- 
sprechenden Dideoxynukleotiden dar. Der fette Pfeil kennzeichnet den 

15 Haupt-Transkriptionsstart, die diinnen Pfeile weisen auf drei Neben- 

Transkriptionsstartpunkte hin. 



Fig. 6: cDNA Sequenz der humanen katalytischen Telomerase-Untereinheit 
(hTC; vgl. unsere anhangige Anmeldung PCT/EP/98/03468). Die 
20 dargestellte Sequenz entspricht SEQ ID NO 2. 

Fig. 7: Strukturelle Organisation und Restriktionsmappe des humanen hTC- 
Gens und dessen 5'- und 3'-flankierende Region. 

25 Exons sind als durchnummerierte schwarz ausgefullte Rechtecke und 

Introns als nicht ausgefullte Bereiche hervorgehoben. Nichttranslatierte 
Sequenzabschnitte in den Exons sind schrafflert. Die Translation startet 
in Exon 1 und endet in Exon 16. Restriktionsenzymschnittstellen sind 
wie folgt gekennzeichnet: S, Sad; X, Xhol. Die relative Anordnung der 

30 fiinf Phagenklone (P2, P3, P5, PI 2, PI 7) und des Produktes aus dem 

^Genomic walking" sind durch diinne Linien hervorgehoben. Wie durch 
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die Punkte gekennzeichnet, ist die Sequenz von Intron 16 nur teilweise 
entschliisselt. 

Fig. 8: HTL Splicevarianten. 

5 

A: Schematische Struktur der hTC mRNA Splicevarianten. Die voll- 
standige hTC mRNA ist als grau unterlegtes Rechteck im oberen Bereich 
der Abb. dargestellt. Die 16 Exons sind entsprechend ihrer GroBe 
dargestellt. Der Translationsstart (ATG) und das Stop-Codon, sovvie das 

10 Telomerase-spezifische T-Motiv und die sieben RT-Motive sind hervor- 

gehoben. Die hTC-Varianten sind in Deletions- und Insertionsvarianten 
unterteilt. In den Deletionen sind die fehlenden Exonsequenzen markiert 
Die Insertionen sind durch zusatzliche weiBe Rechtecke hervorgehoben. 
GroBe und Herkunft der insertierten Sequenzen sind angegeben. Neu 

15 entstandene Stop-Codons sind markiert. Die GroBe der Insertion von 

Variante INS2 ist unbekannt. 

B: Exon Intron Ubergange der hTC-Splice-Varianten. Nichtgesplicte 5'- 
und 3'-flankierte Sequenzen sind als weiBe Rechtecke hervorgehoben. 
20 Die Herkunft der Exon und Intron Sequenzen ist angegeben. Intron und 

Exon Sequenzen sind in Kleinbuchstaben, bzw. in GroBbuchstaben 
dargestellt Die Donor und Akzeptor Sequenzen der Splicestellen sind als 
graue Rechtecke unterlegt und deren Exon Intron Herkunft ist ebenfalls 
angegeben. 

25 

Fig. 9: Identifizierung des Transkriptionsstarts durch RT-PCR Analyse. 

Die RT-PCR wurde mit cDNA-Bibliothek aus HL 60 Zellen und ge- 
nomischer DNA als Positivkontrolle durchgefllhrt. Ein gemeinsamer 3'- 
Primer hybridisiert an eine Sequenzregion aus Exon 1. Die Position der 
30 verschiedenen 5' Primer in der kodierenden Region oder der 5'- 

flankierenden Region ist angegeben. In der Negativkontrolle wurde keine 
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Template-DNA in der PCR-Reaktion zugegeben. M: DNA-GroBen- 
marker. 

Fig. 10: Nukleotidsequenz und Strukturmerkmale des hTC-Promotors. 
5 11273 bp der 5'-flankierenden hTC Gensequenz, beginnend mit dem 

Translationsstartcodon ATG (+1) sind dargestellt. Die putative Region 
des Translationsstarts ist unterstrichen. M5gliche regulatorische Sequenz- 
abschnitte innerhalb der 4000 bp stromaufwarts des Translationsstarts 
sind umrandet. Die dargestellte Sequenz entspricht SEQ ID NO 3. 

10 

Fig. i 1 : Aktivitat des hTC-Promotors in HEK-293 Zellen. 

Im oberen Bereich der Abbildung sind die ersten 5000 bp der 5*- 
flankierenden hTC Genregion schematisch dargestellt. Das ATG- 
Startcodon ist hervorgehoben. CpG reiche Inseln sind durch graue 

15 Rechtecke markiert. Auf der linken Abbildungsseite sind die GroCen der 

hTC Promotor-Luziferase Konstukte dargestellt. Das pomotorlose pGL2- 
Basic Konstrukt und das SV40 Promotorkonstrukt pGL2-Pro wurden in 
jeder Transfektion als Kontrollen eingesetzt. Auf der rechten Abbil- 
dungsseite sind ist die relative Luziferaseaktivitat der verschiedenen 

20 Promotorkonstukte in HEK-Zelien als durchgehende Balken gezeigt. Die 

Standardabweichung ist angegeben. Die Zahlenwerte reprasentieren den 
Durchschnitt von zwei unabhangigen Experimented die in Duplikaten 
durchgeftihrt wurden. 

25 Tab. 1 : Exon Intron Ubergange des hTC-Gens 

Aufgelistet sind die Nukleotidsequenzen an den 3'- und 5' 
SpliceUbergangen des hTC-Gens. Die Konsensussequenzen fur Donor 
und Akzeptorsequenzen (AG und GT) sind durch graue Rechtecke 
unterlegt. Intronsequenzen (Kleinbuchstaben) und Exonsequenzen (Grofl- 

30 buchstaben), die die Spliceakzeptor- und Donorstellen flankieren sind 

gezeigt. Die GroBe der Exons und Introns ist in bp angegeben. 
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Tab. 2: Potentielle Bindungsstellen fur DNA-bindende Faktoren in der 
Nukleotidsequenz von Intron 2 

Die Suche nach moglichen DNA-bindenden Faktoren (z.B. Transkrip- 
tionsfaktoren) wurde mit dem „Find Pattern"-Algorithmuses aus dem 
„GCG Sequenz Analysis" Programmpacket der „Genetics Computer 
Group" (Madison, USA) durchgefiihrt Aufgelistet sind die Abkurzungen 
der identifizierten DNA-bindenden Faktoren und deren Lokalisation in 
Intron 2. 
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Tab. 2 



Faktoren 


Lokalisation in Intron 2 


C/EBP 


2925 


CRE.2 


2749 


Spl 


2378, 4094, 4526, 4787, 4835, 4995 


AP-2 CS3 


5099 


AP-2 CS4 


2213, 3699, 4667, 5878, 5938, 6059, 6180, 6496 


AP-2 CS5 


5350, 5798, 5880, 5940, 6061, 6182, 6375, 6498 


PEA3 


934, 2505 


P53 


2125 


GR uteroglobin 


848, 1487, 2956 


PR uteroglobin 


3331 


Zeste-white 


1577, 1619, 1703, 1745, 1787, 1829, 1871, 1913, 1955, 
1997, 2039, 2081, 3518, 3709, 4765, 5014, 5055 


GRE 


846 


MyoD-MCK right 
site/rev 


447, 509, 558, 1370, 1595, 1900, 2028, 2099, 4557 


MyoD-MCK left site 


108, 118, 453, 1566, 1608, 1692, 1734, 1818, 1902, 
1986, 2372, 2460, 2720, 3491, 5030 


Ets-1 CS 


6408 


API 


3784, 4406 


CREB 


2801 


G ATA- 1 


839, 1390,3154 


c-Myc 


108, 118, 453, 1566, 1608, 1692, 1734, 1818, 1902, 
1986, 2372, 2460, 2720, 3491, 5030 


CACCC site 


991 


CCAAT site 


1224 


CCAC box 


992 


CAAT site 


463, 2395 


Rb site 


992, 4663 


TATA 


3650 


CDEI 


106, 1564, 1606, 1690, 1732, 1816, 1900, 1984 
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Beispiele 

Das menschiiche Gen fur die katalytische Telomerase Untereinheit (ghTC), sowie die 
5' und 3' liegenden Bereiche dieses Gens wurden kloniert, der Startpunkt der 
5 Transkription bestimmt, potentielle Bindungsstellen fUr DNA-bindende Proteine 
identifiziert, sowie aktive Proraotorfragmente aufgezeigt. Die Sequenz der hTC- 
cDNA (Fig. 6) ist bereits in unserer ebenfalls anh£ngigen Anmeldung 
PCT/EP/98/03468 beschrieben. Wenn nicht gesondert erwahnt, beziehen sich samt- 
liche Angaben zur cDNA-Position auf diese Sequenz. 

10 

Beispiel 1 

Durch eine genomische Southern Blot-Analyse wurde bestimmt, ob ghTC im 
menschlichen Genom ein Einzelgen darstellt oder mehrere Loci fur das hTC-Gen 
1 5 bzw. eventuell auch ghTC-Pseudogene existieren. 

Hierzu wurde ein kommerziell erhaltlicher Zoo-Blot der Firma Clontech einer 
Southern Blot-Analyse unterzogen. Dieser Blot enthait 4 |ig Eco Rl geschnittene 
genomische DNA von neun verschiedenen Spezies (Mensch, Affe, Ratte, Maus, 

20 Hund, Rind, Kaninchen, Huhn und Hefe). Mit Ausnahme von Hefe, Huhn und 
Mensch wurde die DNA aus Nierengewebe isoliert. Die humane genomische DNA 
wurde aus Plazenta isoliert und die genomische DNA aus Huhn wurde aus Leberge- 
webe aufgereinigt. Im Autoradiogramm in Fig. 1 wurde als radioaktiv-markierte 
Sonde ein etwa 720 bp langes hTC-cDNA Fragment, isoliert aus der hTC cDNA, 

25 Variante Del2 (Position 1685 bis 2349 plus 2531 bis 2590 der Fig. 6 [Deletion 2; 
vergl. Beispiel 5 der Fig. 8]), eingesetzt. Die experimentellen Bedingungen fiir die 
Hybridisierung und die Waschschritte des Blots erfolgten in Anlehnung an Ausubel 
etal (1987). 

30 Im Fall der humanen DNA erkennt die Sonde zwei spezifische DNA-Fragmente. Das 
kleinere, etwa 1,5 bis 1,8 kb lange Eco RI -Fragment geht vvahrscheinlich auf zwei 
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Eco RJ-Schnittstellen in einem Intron der ghTC-DNA zurilck. Aufgrund dieses 
Ergebnisses ist davon auszugehen, dafl nur ein singulars ghTC-Gen im 
menschlichen Genom voriiegt. 

5 Beispiel 2 

Zur Isolierung der 5' flankierenden hTC-Gensequenz wurden ca 1,5 x 10 6 Phagen 
einer humanen genomischen Plazenta-Genbibliothek (EMBL 3 SP6/T7 der Firma 
Clontech, Bestellnummer HL1067j) auf Nitroze I luiose filter (0,45 urn; Fa. Schleicher 

10 und Schuell) nach Angaben des Herstellers mit einem radioaktiv markierten, etwa 
500 bp langen 5'-hTC-cDNA Fragment (Position 839 bis 1345 der Fig. 6) 
hybridisiert Die Nitrozellulosefilter wurden zunachst in 2 x SSC (0,3 M NaCl; 0,5 M 
Tris-HCl, pH 8,0) und anschliefiend in einer Prahybridisierungslosung (50 % 
Formamid; 5 x SSPE, pH 7,4; 5 x Denhards-LCsung; 0,25 % SDS; 100 ug/ml 

15 Heringsperma-DNA) zwei Stunden bei 42°C inkubiert. Fiir die Hybrididsierung iiber 
Nacht wurde die Prahybridisierungslosung mit 1,5 x 10 6 cpm/ml LSsung dena- 
turierter, radioaktiv markierter Probe erganzt. Unspezifisch gebundene, radioaktive 
DNA wurde unter stringenten Bedingungen, d.h. durch drei funfrninutige Wasch- 
schritte mit 2 x SSC; 0,1 % SDS bei 55 bis 65 °C entfernt. Die Auswertung erfolgte 

20 durch Autoradiographic der Filter. 

Die in dieser Primaruntersuchung identifizierten Phagenklone wurden aufgereinigt 
Ausubel et al (1987). In weitergehenden Analysen stellte sich ein Phagenklon P12 
als potentiell positiv heraus. Eine X-DNA Preparation dieses Phagens Ausubel et al 
25 (1987) und der nachfolgende Restriktionsverdau mit Enzymen, die das genomtsche 
Insert in Fragmenten freisetzen, zeigte, daB dieser Phagenklon ein ca. 15 kb Insert im 
Vektor enthalt (Fig. 2). 

Zur Isolierung der vollstandigen hTC-Gensequenz wurden in unabhangigen 
30 Experimenten jeweils 1 bis 1,5 x 10 6 Phagen mit jeweils verschiedenen radioaktiv 
markierten Sonden wie oben beschrieben durchmustert. 
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Die in diesen Primaruntersuchungen identifizierten, fur die entsprechenden Sonden 
positiven Phagenklone wurden aufgereinigt. Der Phagenklon PI 7 wurde mit einem 
etwa 250 bp iangen hTC-cDNA Fragment (Position 1787 bis 2040 der Fig. 6) 
5 gefunden. Der Phagenklon P2 wurde mit einem etwa 740 bp langen hTC-cDNA 
Fragment (Position 1685 bis 2349 plus 2531 bis 2607 der Fig. 6 [Deletion 2; vergl. 
Beispiel 5]) identifiziert. Die Phagenklone P3 und P5 wurden mit einem 420 bp 
langen 3' hTC-cDNA Fragment (Position 3047 bis 3470 der Fig. 6) gefunden. Nach 
X.-DNA Preparation dieser Phagen und nachfolgendem Restriktionsverdau mit 
10 Enzymen, die das genomische Insert in Fragmenten freisetzen, wurden die Inserts in 
Plasmide umkioniert (Beispiel 4). 

Beispiel 3 

15 Urn zu untersuchen, ob auch das 5'-Ende der hTC-cDNA im Insert des rekombinan- 
ten Phagenklons P12 vorliegt, wurde X-DNA dieses Klons in einer Southern Blot 
Analyse mit einem radioaktiv markierten etwa 440 bp langen hTC-cDNA Fragment 
(Position 1 bis 440 der Fig. 6) aus dem extremen 5'-Bereich hybridisiert (Fig. 3). 

20 Da die isolierte X.-DNA des positiven Klons auch mit dem extremen 5'-Ende der 
hTC-cDNA hybridisiert, enthalt dieser Phage wahrscheinlich auch den das ATG- 
Startcodon flankierenden 5'-Sequenzbereich. 

Beispiel 4 

25 

Um das gesamte 15 kb lange Insert des positiven Phagenklons P12 in Teilfragmenten 
umzuklonieren und anschliefiend zu sequenzieren, wurden zum DNA-Verdau 
Restriktionsendonukieasen ausgewahlt, die zum einem das gesamte Insert aus 
EMBL3 Sp6/T7 freisetzen (vgl. Beispiel 2) und zusatzlich im Insert schneiden. 



30 
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Insgesamt wurden ein etwa 8,3 und ein etwa 6,5 kb langes Xho I-Subfragment sowie 
ein etwa 8,5, ein etwa 3,5 und ein etwa 3 kb langes Sac I -Teil fragment in den Vektor 
pBluescript KS(+) (Fa. Stratagene) umkloniert. Durch Sequenzanalyse dieser 
Fragmente wurde die Nukleotidsequenz von 5123 bp 5'-flankierenden des ghTC- 
5 Genbereichs, ausgehend vom ATG-Startcodon bestimmt (Fig. 4; entsprechend 
SEQ ID NO 1). In der Fig. 4 sind die ersten (ausgehend vom ATG-Startcodon) 5123 
bp dargestellt. In der Fig. 10 (entsprechend SEQ ID NO 3) die gesamte klonierte 5' 
Sequenz. 

10 Um das gesamte ca. 14,6 kb grolk Insert des Phagenklons P17 in Teilfragmenten 
umzuklonieren, wurden zum DNA-Verdau Restriktionsendonukleasen ausgewahlt, 
die zum einen das gesamte Insert aus EMLB3 Sp6/T7 freisetzen und zusatzlich 
einige Male im Insert schneiden. Durch Kombinationsverdau mit den Enzymen Xhol 
und BamHI wurden ein 7,1 kb, ein 4,2 kb und ein 1,5 kb groBes XhoI-BamHI- 

15 Fragment sowie ein 1,8 kb grofles BamHI-Fragment subkloniert. Der Kombinations- 
Restriktionsverdau mit den Enzymen Xhol und Xbal fiihrte zur Klonierung von 
einem 6,5 kb groBen Xhol-Xbal-Fragment, einem 6,5 kb und einem 1,5 kb groftem 
Xhol -Fragment. 

20 Die Umklonierung des ca. 17,9 kb grofiem Inserts des Phagenklons P2 in 
Subfragmente erfolgte durch Verdau mit dem Restriktionsenzym Xhol. Insgesamt 
wurde ein 7,5 kb, ein 6,4 kb sowie ein 1,6 kb langes Xhol-Subfragment kloniert. 
Durch Verdau mit dem Restriktionsenzym Sad wurde zusatzlich ein 4,8 kb, ein 3 kb, 
ein 2 kb sowie ein 1 ,8 kb groBes Sacl-Fragment subkloniert 

25 

Das ca. 13,5 kb grofle Insert des Phagenklons P3 wurde durch Verdau mit den 
Restriktionsenzymen Sad bzw. Xhol subkloniert. Dabei wurden ein 3,2 kb, ein 2 kb, 
ein 0,9 kb, ein 0,8 kb, ein 0,65 kb und ein 0,5 kb langes Sacl-Subfragment sowie ein 
6,5 kb und ein 4,3 kb langes Xhol-Subfragment erhalten. 

30 
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Die Subklonierung des ca. 13,2 kb groBen Inserts des Phagenklons P5 erfolgte durch 
Verdau mit den Restriktionsenzymen Sad bzw. XhoL Insgesamt wurden Sacl- 
Fragmente von 6,5 kb, 3,3 kb, 3,2 kb, 0,8 kb und 0,3 kb GroBe sowie Xhol- 
Fragmente von 7 kb und 3,2 kb GroBe subkloniert. 

5 

Zur Klonierung des 3* von Phagenklon PI 7 und 5 l von Phagenklon P2 gelegenen 
hTC-genoraischen Sequenzbereichs wurden 3 Genomic Walkings mit Hilfe des 
Genome Walker™ Kits der Firma Clontech (Katalognummer K 1803-1) und ver- 
schiedenen Primerkombinationen durchgefuhrt. In einem Endvolumen von 50 p.1 

10 vvurde I ul humaner Genome Walker Library HDL (Fa. Clontech) mit lOpmo! 
dNTP-Mix versetzt und in lxKien Taq PCR-Reaktionspuffer und lxAdvantage Klen 
Taq Polymerase Mix (Fa. Clontech) eine PCR-Reaktion durchgefuhrt. Als Primer 
wurden 10 pmol eines internen genspezifischen Primers sowie 10 pmol des Adaptor 
Primers API (S'-GTAATACGACTCACTATAGGGC^ 1 ; Fa. Clontech) zugefugt. 

15 Die PCR wurde als Touchdown-PCR in 3 Schritten durchgefuhrt. Zunachst wurde 
uber 7 Zyklen fur 20 sec bei 94°C denaturiert und anschlie&end fur 4 min bei 72°C 
die Primer angelagert und die DNA-Kette verlangert. Es folgten 37 Zyklen bei denen 
fur 20 sec die DNA bei 94°C denaturiert wurde, die anschiieBende Primerver- 
langerung aber fur 4 min bei 67°C erfolgte. AbschlieBend folgte eine Kettenver- 

20 langerung fur 4 min bei 67°C. Im AnschluB an diese erste PCR wurde das PCR- 
Produkt 1:50 verdunnt. Ein \x\ dieser Verdiinnung wurde in einer zweiten „nested" 
PCR zusammen mit 10 pmol dNTP-Mix in lxKien Taq PCR-Reaktionspuffer und 
lxAdvantage Klen Taq Polymerase-Mix sowie 10 pmol eines „nested" gen- 
spezifischen Primers und 10 pmol des „nested" Marathon Adaptor Primers AP2 (5'- 

25 ACTATAGGGC ACGCGTGGT-3 ' ; Fa. Clontech) eingesetzt. Die PCR-Bedingungen 
entsprachen den in der ersten PCR gewahlten Parametern. Als einzige Ausnahme 
wurden im ersten PCR-Schritt statt 7 Zyklen nur 5 Zyklen gewahlt und im zweiten 
PCR-Schritt statt 37 Zyklen nur 24 Zyklen durchlaufen. Produkte dieser Nested- 
GenomicWalking-PCR wurden in den TA-Cloning Vektor pCRII der Fa. InVitrogen 

30 kloniert. 
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Im ersten Genomic Walking wurde der genspezifische Primer C3K2-GSP1 (5'- 
G ACGTGGCTCTTG AAGGCCTTG-3 ' ) sowie der „nested" genspezifische Primer 
C3K2-GSP2 (5 4 -GCCTTCTGGACCACGGCATACC-3') zusammen mit der HDL- 
Library 4 eingesetzt und ein 1639 bp langes PCR-Fragment erhalten. Im zweiten 

5 Genomic Walking wurde mit dem genspezifischen Primer C3F2 (5'- 
CGTAGTTG AGC ACGCTG AAC AGTG-3 ') und dem ^nested 1 ' genspezifischen 
Primer C3F (5 * -CCTTC ACCCTCG AGGTG AG ACGCT-3 * ) aus der HDL-Library 4 
ein PCR-Fragment von 685 bp Lange amplifiziert. Der dritte Genomic Walking 
Ansatz fuhrte unter Einsatz des genspezifischen Primers DEL5-GSP1 (5 4 - 

10 GGTGG ATGTG ACGGGCGCGTACG-3 ' ) und des „nested" genspezifischen 
Primers C5K-GSP1 (5 t -GGTATGCCGTGGTCCAGAAGGC-3 t ) zur Klonierung 
eines 924 bp PCR-Fragments aus der HDL-Library 1 . Insgesamt wurden durch dieses 
Genomic Walking- Verfahren 2100 bp der 3 l von Phagenklon PI 7 gelegenen 
genomischen hTC-Region identifiziert (s. Fig. 7). 

15 

Die subklonierten Fragmente sowie die Genomic Walking-Produkte wurden ein- 
zelstrangig sequenziert. Unter Verwendung der Lasergene Biocomputing Software 
(DNASTAR Inc. Madison, Wisconsin, USA) wurden iiberlappende Bereiche 
identifiziert und Contigs gebildet. Insgesamt wurden aus den gesammelten 

20 Sequenzen der Phagenklone PI 2, PI 7, P2, P3 und P5 sowie den Sequenzdaten aus 
dem Genomic Walking 2 grofle Contigs zusammengestellt. Contig 1 besteht aus 
Sequenzdaten von Phagenklon P12, PI 7 und den Sequenzdaten aus dem Genomic 
Walking. Contig 2 wurde aus den Sequenzen von Phagenklon P2, P3 und P5 
zusammengesetzt. Oberlappende Phagenklonbereiche sind in Fig. 7 schematisch 

25 dargestellt. Die Sequenzdaten der 2 Contigs sind nachfolgend dargestellt. Das ATG 
Startcodon in Contig 1 ist unterstrichen. Das TGA Stopcodon ist in Contig 2 
unterstrichen. 
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Contigl: 



ACTTGAGCCC AAGAGTTCAA GGCTACGGTG AGCCATGATT GCAACACCAC ACGCCAGCCT TGGTGACAGA 70 
ATGAGACCCT GTCTCAAAAA AAAAAAAAAA AATTGAAATA ATATAAAGCA TCTTCTCTGG CCACAGTGGA 140 
ACAAAACCAG AAATCAACAA CAAGAGGAAT TTTGAAAACT ATACAAACAC ATGAAAATTA AACAATATAC 210 
TTCTGAATGA CCAGTGAGTC AATGAAGAAA TTAAAAAGGA AATTGAAAAA TTTATTTAAG CAAATGATAA 280 
CGGAAACATA ACCTCTCAAA ACCCACGGTA TACAGCAAAA GCAGTGCTAA GAAGGAAGTT TATAGCTATA 350 
AGCAGCTACA TCAAAAAAGT AGAAAAGCCA GGCGCAGTGG CTCATCCCTG TAATCCCAGC ACTTTGGGAG 420 
GCCAAGGCGG GCAGATCGCC TGAGGTCAGG AGTTCGAGAC CAGCCTGACC AACACAGAGA AACCTTGTCG 4 90 
CTACTAAAAA TACAAAATTA GCTGGGCATG GTGGCACATG CCTGTAATCC CAGCTACTCG GGAGGCTGAG 5 60 
GCAGGATAAC CGCTTGAACC CAGGAGGTGG AGGTTGCGGT GAGCCGGGAT TGCGCCATTG GACTCCAGCC 630 
TGGGTAACAA GAGTGAAACC CTGTCTCAAG AAAAAAAAAA AAGTAGAAAA ACTTAAAAAT ACAACCTAAT 700 
GATGCACCTT AAAGAACTAG AAAACCAAGA GCAAACTAAA CCTAAAATTG GTAAAAGAAA AGAAATAATA 770 
AAGATCAGAG CAGAAATAAA TGAAACTGAA AGATAACAAT ACAAAAGATC AACAAAATTA AAAGTTGGTT 840 
TTTTGAAAAG ATAAACAAAA TTGACAAACC TTTGCCCAGA CTAAGAAAAA AGGAAAGAAG ACCTAAATAA 910 
ATAAAGTCAG AGATGAAAAA AGAGACATTA CAACTGATAC CACAGAAATT CAAAGGATCA CTAGAGGCTA 980 
CTATGAGCAA CTGTACACTA ATAAATTGAA AAACCTAGAA AAAATAGATA AATTCCTAGA TGCATACAAC 1050 
CTACCAAGAT TGAACCATGA AGAAATCCAA AGCCCAAACA GACCAATAAC AATAATGGGA TTAAAGCCAT 1120 
AATAAAAAGT CTCCTAGCAA AGAGAAGCCC AGGACCCAAT GGCTTCCCTG CTGGATTTTA CCAATCATTT 1190 
AAAGAAGAAT GAATTCCAAT CCTACTCAAA CTATTCTGAA AAATAGAGGA AAGAATACTT CCAAACTCAT 1260 
TCTACATGGC CAGTATTACC CTGATTCCAA AACCAGACAA AAACACATCA AAAACAAACA AACAAAAAAA 1330 
CAGAAAGAAA GAAAACTACA GGCCAATATC CCTGATGAAT ACTGATACAA AAATCCTCAA CAAAACACTA 14 00 
GCAAACCAAA TTAAACAACA CCTTCGAAAG ATCATTCATT GTGATCAAGT GGGATTTATT CCAGGGATGG 1470 
AAGGATGGTT CAACATATGC AAATCAATCA ATGTGATACA TCATCCCAAC AAAATGAAGT ACAAAAACTA 1540 
TATGATTATT TCACTTTATG CAGAAAAAGC ATTTGATAAA ATTCTGCACC CTTCATGATA AAAACCCTCA 1510 
AAAAACCAGG TATACAAGAA ACATACAGGC CAGGCACAGT GGCTCACACC TGCGATCCCA GCACTCTGGG 1680 
AGGCCAAGGT GGGATGATTG CTTGGGCCCA GGAGTTTGAG ACTAGCCTGG GCAACAAAAT GAGACCTGGT 1750 
CT AC AAA AAA CTTTTTTAAA AAATTAGCCA GGCATGATGG CATATGCCTG TAGTCCCAGC TAGTCTGGAG 1820 
GCTGAGGTGG GAGAATCACT TAAGCCTAGG AGGTCGAGGC TGCAGTGAGC CATGAACATG TCACTGTACT 1890 
CCAGCCTAGA CAACAGAACA AGACCCCACT GAATAAGAAG AAGGAGAAGG AGAAGGGAGA AGGGAGGGAG 1960 
AAGGGAGGAG GAGGAGAAGG AGGAGGTGGA GGAGAAGTGG AAGGGGAAGG GGAAGGGAAA GAGGAAGAAG 2030 
AAGAAACATA TTTCAACATA ATAAAAGCCC TATATGACAG ACCGAGGTAG TATTATGAGG AAAAACTGAA 2100 
AGCCTTTCCT CTAAGATCTG GAAAATGACA AGGGCCCACT TTCACCACTG TGATTCAACA TAGTACTAGA 2170 
AGTCCTAGCT AGAGCAATCA GATAAGAGAA AGAAATAAAA GGCATCCAAA CTGGAAAGGA AGAAGTCAAA 2240 
TTATCCTGTT TGCAGATGAT ATGATCTTAT ATCTGGAAAA GACTTAAGAC ACCACTAAAA AACTATTAGA 2310 
GCTGAAATTT GGTACAGCAG GATACAAAAT CAATGTACAA AAATCAGTAG TATTTCTATA TTCCAACAGC 2380 
AAACAATCTG AAAAAGAAAC CAAAAAAGCA GCTACAAATA AAATTAAACA GCTAGGAATT AACCAAAGAA 2450 
GTGAAAGATC TCTACAATGA AAACTATAAA ATGTTGATAA AAGAAATTGA AGAGGGCACA AAAAAAGAAA 2520 
AGATATTCCA TGTTCATAGA TTGGAAGAAT AAATACTGTT AAAATGTCCA TACTACCCAA AGCAATTTAC 2590 
AAATTCAATG CAATCCCTAT TAAAATACTA ATGACGTTCT TCACAGAAAT AGAAGAAACA ATTCTAAGAT 2660 
TTGTACAGAA CCACAAAAGA CCCAGAATAG CCAAAGCTAT CCTGACCAAA AAGAACAAAA CTGGAAGCAT 27 30 
CACATTACCT GACTTCAAAT TATACTACAA AGCTATAGTA ACCCAAACTA CATGGTACTG GCATAAAAAC 2800 
AGATGAGACA TGGACCAGAG GAACAGAATA GAGAATCCAG AAACAAATCC ATGCATCTAC AGTGAACTCA 2870 
TTTTTGACAA AGGTGCCAAG AACATACTTT GGGGAAAAGA TAATCTCTTC AATAAATGGT GCTGGAGGAA 2940 
CTGGATATCC ATATGCAAAA TAACAATACT AGAACTCTGT CTCTCACCAT ATACAAAAGC AAATCAAAAT 3010 
GGATGAAAGG CTTAAATCTA AAACCTCAAA CTTTGCAACT ACTAAAAGAA AACACCGGAG AAACTCTCCA 3080 
GGACATTGGA GTGGGCAAAG ACTTCTTGAG TAATTCCCTG CAGGCACAGG CAACCAAAGC AAAAACAGAC 3150 
AAATGGGATC ATATCAAGTT AAAAAGCTTC TGCCCAGCAA AGGAAACAAT CAACAAAGAG AAGAGACAAC 3220 
CCACAGAATG GGAGAATATA TTTGCAAACT ATTCATCTAA CAAGGAATTA ATAACCAGTA TATATAAGGA 3290 
GCTCAAACTA CTCTATAAGA AAAACACCTA ATAAGCTGAT TTTCAAAAAT AAGCAAAAGA TCTGCGTAGA 3360 
CATTTCTCAA AATAAGTCAT ACAAATGGCA AACAGGCATC TGAAAATGTG CTCAACACCA CTGATCATCA 34 30 
GAGAAATGCA AATCAAAACT ACTATGAGAG ATCATCTCAT CCCAGTTAAA ATGGCTTTTA TTCAAAAGAC 3500 
AGGCAATAAC AAATGCCAGT GAGGATGTGG ATAAAAGGAA ACCCTTGGAC ACTGTTGGTG GGAATGGAAA 3570 
TTGCTACCAC TATGGAGAAC AGTTTGAAAG TTCCTCAAAA AACTAAAAAT AAAGCTACCA TACAGCAATC 3 640 
CCATTGCTAG GTATATACTC CAAAAAAGGG AATCAGTGTA TCAACAAGCT ATCTCCACTC CCACATTTAC 3710 
TGCAGCACTG TTCATAGCAG CCAAGGTTTG GAAGCAACCT CAGTGTCCAT CAACAGACGA ATGGAAAAAG 3780 
AAAATGTGGT GCACATACAC AATGGAGTAC TACGCAGCCA TAAAAAAGAA TGAGATCCTG TCAGTTGCAA 3850 
CAGCATGGGG GGCACTGGTC AGTATGTTAA GTGAAATAAG CCAGGCACAG AAAGACAAAC TTTTCATGTT 3920 
CTCCCTTACT TGTGGGAGCA AAAATTAAAA CAATTGACAT AGAAATAGAG GAGAATGGTG GTTCTAGAGG 3990 
GGTGGGGGAC AGGGTGACTA GAGTCAACAA TAATTTATTG TATGTTTTAA AATAACTAAA AGAGTATAAT 4060 
TGGGTTGTTT GTAACACAAA GAAAGGATAA ATGCTTGAAG GTGACAGATA CCCCATTTAC CCTGATGTGA 4130 
TTATTACACA TTGTATGCCT GTATCAAAAT ATCTCATGTA TGCTATAGAT ATAAACCCTA CT AT ATT AAA 4200 
AATTAAAATT TTAATGGCCA GGCACGGTGG CTCATGTCCG TAATCCCAGC ACTTTGGGAG GCCGAGGCGG 4270 
GTGGATCACC TGAGGTCAGG AGTTTGAAAC CAGTCTGGCC ACCATGATGA AACCCTGTCT CTACTAAAGA 4340 
TACAAAAATT AGCCAGGCGT GGTGGCACAT ACCTGTAGTC CCAACTACTC AGGAGGCTGA GACAGGAGAA 4 410 
TTGCTTGAAC CTGGGAGGCG GAGGTTGCAG TGAGCCGAGA TCATGCCACT GCACTGCAGC CTGGGTGACA 4 480 
GAGCAAGACT CCATCTCAAA ACAAAAACAA AAAAAAGAAG ATTAAAATTG TAATTTTTAT GTACCGTATA 4 550 
AATATATACT CTACTATATT AGAAGTTAAA AATTAAAACA ATTATAAAAG GTAATTAACC ACTTAATCTA 4 620 
AAATAAGAAC AATGTATGTG GGGTTTCTAG CTTCTGAAGA AGTAAAAGTT ATGGCCACGA TGGCAGAAAT 4 690 
GTGAGGAGGG AACAGTGGAA GTTACTGTTG TTAGACGCTC ATACTCTCTG TAAGTGACTT AATTTTAACC 47 60 
AAAGACAGGC TGGGAGAAGT TAAAGAGGCA TTCTATAAGC CCTAAAACAA CTGCTAATAA TGGTGAAAGG 4830 
TAATCTCTAT TAATTACCAA TAATTACAGA TATCTCTAAA ATCGAGCTGC AGAATTGGCA CGTCTGATCA 4900 
CACCGTCCTC TCATTCACGG TGCTTTTTTT CTTGTGTGCT TGGAGATTTT CGATTGTGTG TTCGTGTTTG 4 970 
GTTAAACTTA ATCTGTATGA ATCCTGAAAC GAAAAATGGT GGTGATTTCC TCCAGAAGAA TTAGAGTACC 5040 
TGGCAGGAAG . CAGGTGGCTC TGTGGACCTG AGCCACTTCA ATCTTCAAGG GTCTCTGGCC AAGACCCAGG 5110 
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TGCAAGGCAG AGGCCTGATG ACCCGAGGAC AGGAAAGCTC 
CGTTGGTGAG CAGCGCATGA AGTGCCCTTA TTTACGCTTT 
AGGCGGCCAG CGGGAATGCA AGGAGTCAGA AGCCTCCTGC 
CCCGGGCGTG TGCCAGAGGG AGAGGAGTCA AGGCACCTCG 
AGCAGTGACC AAGGTGTATT CTGAGGGAAG CTTGAGTTAG 
GCACCCTTCT CAAGGGAAAA CCAGACGCCC GCTCTGCGGT 
CCCTCGCGGT TTCTGATCGG GACAGAGTGA CCCCCGTGGA 
TGCAAAGGGC TCCACAGACC CCCGCCCTGG AGAGAGGAGT 
TGGCTGGGGG CGGACAGCGA CGGCGGGATT CAAAGACTTA 
CCGAATGGAT TTGGATTTTA TCTTAATATT TTCTTAAATT 
CCAAAGGCGT AAAACAGGAA CTGAGCTATG TTTGCCAAGG 
ATTTTTCGCC CTAAGTACTT TTTATTGGTT TTCATAAGGT 
AGAGGCCTGG GCGGCAGGGC TATGAGCACG GCAGGGCCAC 
ACAGCAGGAC CACTGACCGT CCTCCCTGGG AGCTGCCACA 
GTGACTCAGG ACCCCATACC GGCTTCCTGG GCCCACCCAC 
CCGTGGAAAC GAACATGACC CTTGCCTGCC TGCTTCCCTG 
GGAAATGGCC ATGTAAATTA CACGACTCTG CTGATGGGGA 
CCCAAGGACT GAATGATTCC AGCAACTTCT TCGGGTGTGA 
ACTCTTTTAC TAGGCCCACA GAGCACGGSC CACACCCCTG 
GCTTTCAGCC ACCAGGCTGG GGTGACAACA GCGGCTGAAC 
CAGGCACTCC CCCAGATTCT AGGGCCTGGT TGCTGCTTCC 
CTGGGGTGCC ACACTGAGGC CAGCCCTGTC TCCACACCCT 
TTCCTAAACC CTGGGTGGGC CGTGTTCCAG CGCTACTGTC 
ACGTAGCTCG CACGGTTCCT CCTCACATGG GGTGTCTGTC 
GAGGAGATTC TGCGCCTCCC AGACTGGCTC CTCTGAGCCT 
CCTGGCGTCC GGCTGCACGC TGACCTCCAT TTCCAGGCGC 
CCGGTGTGTT CTTCTGTTTC TGTGCTCCTT TCCACGTCCA 
GGGGTTTTTA TAGGCATAGG ACGGGGGCGT GGTGGGCCAG 
TGAAAGTAGG AGTGCCTGTC CTCACCTAGG TCCACGGGCA 
CCCGCCCTTC TCTGCCCAGC ACTTTCCTGC CCCCCTCCCT 
ACTAAGCATC CTCTTCCCAA AAGACCCAGC ATTGGCACCC 
CACGTGACTA CGCACATCAT GTACACACTC CCGTCCACGA 
CAAAGCAGGG AAATCCCTGC TAAAATGTCC TTTAACAAAC 
GGACAGTTCC TCACAGTGAA GAGGAACATG CCGTTTATAA 
GAGTCAAAAC TGCCACCTCC ATGGGATACG TACGCAACAT 
AGGGGAGTGG TTAGGGGGGT TAAGGACGGT GGGGGCGGCA 
AAGCCAGTTT CCTGGTTCTG ATGGTATTGG CTCAGTTATG 
GGAACCCGGA GGCTGTGCCA TCTTTGCCAT GCCCGAGTGT 
ACGTCCTGAT TCCCCCAAAC CTGTGGACAG AACCCGCCCG 
TGAGGACCCT GAGGTCTGGG ATCCTTCGGG ACTACCTGCA 
AGAGGCGGGC AGGAGGGTCA GAGGGGGGCA GCCTCAGGAC 
GGAGGGAGGG CCTCGAGCCC AGGCCTGCAA GCGCCTCCAG 
ACGGAGCCTG CAGCAGGAAG GCACGGCTGG CCCTTAGCCC 
GTGCCATAGG AGGGCACTCG CGCTGCCCTT CTAGCATGAA 
ACCCATGCAC TGTGAATCTA GGATTATTTC AAAACAAAGG 
GTGCCTCCGG GCAAGGGCAG GGCAGGCACG AGTGATTTTA 
CTGAGACAGA GTTATGCTCT TGTTGCCCAG GCTGGAGTGC 
CGTCTCCTGG GTTCAAGCAA TTCTCGTGCC TCAGCCTCCC 
ACACCCGGCT AATTTTGTAT TTTTAGTAGA GATGGGCTTT 
CTGACCTCAG GTGATCCGCC CACCTCAGCC TCCCAAAGTG 
GGCCTATTTA ACCATTTTAA AACTTCCCTG GGCTCAAGTC 
AATTTCCCCT TTACTCAGGA GTTACCCTCC TTTGATATTT 
CGTCTCTTGA CATATTCACA GTTTCTGTGA CCACCTGTTA 
GAGGCTGCAG GCTTCAGGTC CCAGTGGGGT TGCCATCTGC 
AAGTGTGGAC ACTGTCCTGA ATCTCAATGT CTCAGTGTGT 
CTCCTACTCT ACTGGGATTG AGCCCCTTCC CTATCCCCCC 
TGGAGGAAGG AATGATACTT TGTTATTTTT CACTGCTGGT 
TTTGTTTTGT TTTGAGAGGC GGTTTCACTC TTGTTGCTCA 
GCTTACTGCA GCCTCTGCCT CCCAGGTTCA AGTGATTCTC 
CAGGCACCCG CCACCATGCC CAGCTAATTT TTTGTATTTT 
ATGTTGGCCA GGCTGGTCTC GAACTTCTGA CCTCAGATGA 
GATTACAGGT GTGAGCCACC ATGCCCAGCT CAGAATTTAC 
GAAGCTCACC CCACTCAAGT GTTGTGGTGT TTTAAGCCAA 
CTCTTGATGT TTTACACTGT GATGACTAAG AC AT CATC AG 
ATACTGGGGT GTCTTCTGGG TATCAGCAAT CTTCATTGAA 
GGTGTTAATT ACTCCAGCAT AATCTTCTGC TTCCATTTCT 
ATGTTGGCTT CTCTGCAGAG AACCAGTGTA AGCTACAACT 
GCCCCTTTGC CCTAGTGGCA GAGACAATTC ACAAACACAG 
GGATTTCTAG AAGAGCGACC TGTAATCCTA AGTATTTACA 
GCCCAGGGAG GGTGCGAGGC CTGTTCAAAT GCTAGCTCCA 
GAAAGTAGGA AAGGTTACAT TTAAGGTTGC GTTTGTTAGC 
ATCCCTGCAA GGCCTCGGGA GACCCAGAAG TTTCTCGCCC 
CTGGATTCCT GGGAAGTCCT CAGCTGTCCT GCGGTTGTGC 
CCGTGTGGCT TCTACTGCTG GGCTGGAAGT CGGGCCTCCT 
GCCTGGACCC CGAGGCTGCC CTCCACCCTG TGCGGGCGGG 
ACAGAGTGCC GGGGCCCAGG GTCAAGGCCG TTGTGGCTGG 
GCGCCTGGCT CCATTTCCCA CCCTTTCTCG ACGGGACCGC 



GGATGGGAAG GGGCGATGAG AAGCCTGCCT 5180 
GCAAAGATTG CTCTGGATAC CATCTGGAAA 5250 
TCAAACCCAG GCCAGCAGCT ATGGCGCCCA 5320 
AAGTATGGCT TAAATCTTTT TTTCACCTGA 5390 
GTGCCTTCTT TAAAACAGAA AGTCATGGAA 5460 
CATTTACCTC TTTCCTCTCT CCCTCTCTTG 5530 
GCTTCTCCGA GCCCGTGCTG AGGACCCTCT 5600 
CTGAGCCTGG CTTAATAACA AACTGGGATG 5670 
ATTCCATGAG TAAATTCAAC CTTTCCACAT 5740 
TCATCAAATA ACATTCAGGA CTGCAGAAAT 5810 
TCCAAGGACT TAATAACCAT GTTCAGAGGG 5880 
GGCTTAGGGT GCAAGGGAAA GTACACGAGG 5950 
CGGGGAGAGA GTCCCCGGCC TGGGAGGCTG 6020 
TTGGGCAACG CGAAGGCGGC CACGCTGCGT 6090 
ACTAACCCAG GAAGTCACGG AGCTCTGAAC 6160 
GGTGGGTCAA GGGTAATGAA GTGGTGTGCA 6230 
CCGTTCCTTC CATCATTATT CATCTTCACC 6300 
CAAGCCATGA CAAAACTCAG TACAAACACC 6370 
ATATATTAAG AGTCCAGGAG AGATGAGGCT 6440 
AGTCTGTTCC TCTAGACTAG TAGACCCTGG 6510 
CGAGGGCGCC ATCTGCCCTG GAGACTCAGC 6580 
CCGCCTCCAG GCCTCAGCTT CTCCAGCAGC 6650 
TCACCTGTCC CACTGTGTCT TGTCTCAGCG 6720 
TCCTTCCCCA ACACTCACAT GCGTTGAAGG 6790 
GAACCTGGCT CGTGGCCCCC GATGCAGGTT 6860 
TCCCCGTCTC CTGTCATCTG CCGGGGCCTG 6930 
GCTGCGTGTG TCTCTGCCCG CTAGGGTCTC 7000 
GGCGCTCTTG GGAAATGCAA CATTTGGGTG 7070 
CAGGCCTGGG GATGGAGCCC CCGCCAGGGA 7140 
CTGGAACACA GAGTGGCAGT T7CCACAA GC 7210 
CTGGACATTT GCCCCACAGC CCTGGGAATT 7280 
CCGACCCCCG CTGTTTTATT TTAATAGCTA 7350 
TGGTTAAACA AACGGGTCCA TCCGCACGGT 7420 
AGCCTGCAGG CATCTCAAGG GAATTACGCT 7 490 
GCTCAAAAAG AAAGAATTTC ACCCCATGGC 7560 
GCTGGGGGCT ACTGCACGCA CCTTTTACTA 7 630 
GGAGACTAAC CATAGGGGAG TGGGGATGGG 7700 
CCTGGGCAGG ATAATGCTCT AGAGATGCCC 7770 
GCCCCAGGGC CTTTGCAGGT GTGATCTCCG 7840 
GGCCCGAAAA GTAATCCAGG GGTTCTGGGA 7910 
GATGGAGGCA GTCAGTCTGA GGCTGAAAAG 7980 
AAGCTGGAAA AAGCGGGGAA GGGACCCTCC 8050 
ACCAGGGCCC ATCGTGGACC TCCGGCCTCC 8120 
GTGTGTGGGG ATTTGCAGAA GCAACAGGAA 8190 
TTTACAGAAA CATCCAAGGA CAGGGCTGAA 8260 
TTTAGCTATT TTATTTTATT TACTTACTTT 8330 
AGCGGCATGA TCTTGGCTCA CTGCAACCTC 8400 
AAGTAGCTGG GATTTCAGGC GTGCACCACC 8470 
CACCATGTTG G7CAAGCTGA TCTCAAAATC 8540 
CTGGGATTAC AGGCATGAGC CACTGCACCT 8610 
ACACCCACTG GTAAGGAGTT CATGGAGTTC 8 680 
TCTGTAATTC TTCGTAGACT GGGGATACAC 8750 
TCCCATGGGA CCCACTGCAG GGGCAGCTGG 8820 
CAGTAGAAAC CTGATGTAGA ATCAGGGCGC 8890 
GCTGAAACAT GTAGAAATTA AAGTCCATCC 8960 
CCAGGGGCAG AGGAGTTCCT CTCACTCCTG 9030 
ACTGAATCCA CTGTTTCATT TGTTGGTTTG 9100 
GGCTGGAGGG AGTGCAATGG CGCGATCTTG 9170 
CTGCTTCCGC C7CCCATTTG GCTGGGATTA 9240 
TAGTAGAGAC GGGGGTGGGT GGGGTTCACC 9310 
TCCACCTGCC TCTGCCTCCT AAAGTGCTGG 9380 
TCTGTTTAGA AACATCTGGG TCTGAGGTAG 9450 
TGATAGAATT TTTTTATTGT TGTTAGAACA 9520 
CTTTTCAAAG ACACACTAAC TGCACCCATA 9590 
TGCCGGGAGG CGTTTCCTCG CCATGCACAT 9660 
TCTCTTCCCT CTTTTAAAAT TGTGTTTTCT 97 30 
TAACTTTTGT TGGAACAAAT TTTCCAAACC 9800 
CCCTTTAAAA AGGCTTAGGG ATCACTAAGG 9870 
AGACGAGGCT AACCTCCAGC GAGCGTGACA 9940 
TAAATAAAGC AATTTCCTCC GGCAGTTTCT 10010 
ATTTCAGTGT TTGCCGACCT CAGCTACAGC 10080 
CCTTAGATCC AAACTTGAGC AACCCGGAGT 10150 
CGGGGCCCCA GGTCTGGAGG GGACCAGTGG 10220 
AGCTCTGCAG TCCGAGGCTT GGAGCCAGGT 10290 
ATGTGACCAG ATGTTGGCCT CATCTGCCAG 10360 
TGTGAGGCGC CCGGTGCGCG GCCAGCAGGA 10430 
CCCGGTGGGT GATTAACAGA TTTGGGGTGG 10500 
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TTTGCTCATG GTGGGGACCC CTCGCCGCCT GAGAACCTGC AAAGAGAAAT GACGGGCCTG TGTCAAGGAG 10570 
CCCAAGTCGC GGGGAAGTGT TGCAGGGAGG CACTCCGGGA GGTCCCGCGT GCCCGTCCAG GGAGCAATGC 10640 
GTCCTCGGGT TCGTCCCCAG CCGCGTCTAC GCGCCTCCGT CCTCCCCTTC ACGTCCGGCA TTCGTGGTGC 10710 
CCGGAGCCCG ACGCCCCGCG TCCGGACCTG GAGGCAGCCC TGGGTCTCCG GATCAGGCCA GCGGCCAAAG 107 BO 
GGTCGCCGCA CGCACC7GTT CCCAGGGCCT CCACATCATG GCCCCTCCCT CGGGTTACCC CACAGCCTAG 10850 
GCCGATTCGA CCTCTCTCCG CTGGGGCCCT CGCTGGCGTC CCTGCACCCT GGGAGCGCGA GCGGCGCGCG 10920 
GGCGGGGAAG CGCGGCCCAG ACCCCCGGGT CCGCCCGGAG CAGCTGCGCT GTCGGGGCCA GGCCGGGCTC 10990 
CCAGTGGATT CGCGGGCACA GACGCCCAGG ACCGCGCTCC CCACGTGGCG GAGGGACTGG GGACCCGGGC 11060 
ACCCGTCCTG CCCCTTCACC TTCCAGCTCC GCCTCCTCCG CGCGGACCCC GCCCCGTCCC GACCCCTCCC 11130 
GGGTCCCCGG CCCAGCCCCC TCCGGGCCCT CCCAGCCCCT CCCCTTCCTT TCCGCGGCCC CGCCCTCTCC 11200 
TCGCGGCGCG AGTTTCAGGC AGCGCTGCGT CCTGCTGCGC ACGTGGGAAG CCCTGGCCCC GGCCACCCCC 11270 
GCGATGCCGC GCGCTCCCCG CTGCCGAGCC GTGCGCTCCC TGCTGCGCAG CCACTACCGC GAGGTGCTGC 11340 
CGCTGGCCAC GTTCGTGCGG CGCCTGGGGC CCCAGGGCTG GCGGCTGGTG CAGCGCGGGG ACCCGGCGGC 11410 
TTTCCGCGCG CTGGTGGCCC AGTGCCTGGT GTGCGTGCCC TGGGACGCAC GGCCGCCCCC CGCCGCCCCC 11480 
TCCTTCCGCC AGGTGGGCCT CCCCGGGGTC GGCGTCCGGC TGGGGTTGAG GGCGGCCGGG GGGAACCAGC 11550 
GACATGCGGA GAGCAGCGCA GGCGACTCAG GGCGCTTCCC CCGCAGGTGT CCTGCCTGAA GGAGCTGGTG 11620 
GCCCGAGTGC TGCAGAGGCT GTGCGAGCGC GGCGCGAAGA ACGTGCTGGC CTTCGGCTTC GCGCTGCTGG 11690 
ACGGGGCCCG CGGGGGCCCC CCCGAGGCCT TCACCACCAG CGTGCGCAGC TACCTGCCCA ACACGGTGAC 117 60 
CGACGCACTG CGGGGGAGCG GGGCGTGGGG GCTGCTGCTG CGCCGCGTGG GCGACGACGT GCTGGTTCAC 11830 
CTGCTGGCAC GCTGCGCGCT CTTTGTGCTG GTGGCTCCCA GCTGCGCCTA CCAGGTGTGC GGGCCGCCGC 11900 
TGTACCAGCT CGGCGCTGCC ACTCAGGCCC GGCCCCCGCC ACACGCTAGT GGACCCCGAA GGCGTCTGGG 11970 
ATGCGAACGG GCCTGGAACC ATAGCGTCAG GGAGGCCGGG GTCCCCCTGG GCCTGCCAGC CCCGGGTGCG 12040 
AGGAGGCGCG GGGGCAGTGC CAGCCGAAGT CTGCCGTTGC CCAAGAGGCC CAGGCGTGGC GCTGCCCCTG 12110 
AGCCGGAGCG GACGCCCGTT GGGCAGGGGT CCTGGGCCCA CCCGGGCAGG ACGCGTGGAC CGAGTGACCG 12180 
TGGTTTCTGT GTGGTGTCAC CTGCCAGACC CGCCGAAGAA GCCACCTCTT TGGAGGGTGC GCTCTCTGGC 12250 
ACGCGCCACT CCCACCCATC CGTGGGCCGC CAGCACCACG CAGGCCCCCC ATCCACATCG CGGCCACCAC 12320 
GTCCCTGGGA CACGCCTTGT CCCCCGGTGT ACGCCGAGAC CAAGCACTTC C7CTACTCCT CAGGCGACAA 12390 
GGAGCAGCTG CGGCCCTCCT TCCTACTCAG CTCTCTGAGG CCCAGCCTGA CTGGCGCTCG GAGGCTCGTG 124 60 
GAGACCATCT TTCTGGGTTC CAGGCCCTGG ATGCCAGGGA CTCCCCGCAG GTTGCCCCGC CTGCCCCAGC 12530 
GCTACTGGCA AATGCGGCCC CTGTTTCTGG AGCTGCTTGG GAACCACGCG CAGTGCCCCT ACGGGGTGCT 12600 
CCTCAAGACG CACTGCCCGC TGCGAGCTGC GGTCACCCCA GCAGCCGGTG TCTGTGCCCG GGAGAAGCCC 12670 
CAGGGCTCTG TGGCGGCCCC CGAGGAGGAG GACACAGACC CCCGTCGCCT GGTGCAGCTG CTCCGCCAGC 12740 
ACAGCAGCCC CTGGCAGGTG TACGGCTTCG TGCGGGCCTG CCTGCGCCGG CTGGTGCCCC CAGGCCTCTG 12810 
GGGCTCCAGG CACAACGAAC GCCGCTTCCT CAGGAACACC AAGAAGTTCA TCTCCCTGGG GAAGCATGCC 12880 
AAGCTCTCGC TGCAGGAGCT GACGTGGAAG ATGAGCGTGC GGGACTGCGC TTGGCTGCGC AGGAGCCCAG 12950 
GTGAGGAGGT GGTGGCCGTC GAGGGCCCAG GCCCCAGAGC TGAATGCAGT AGGGGCTCAG AAAAGGGGGC 13020 
AGGCAGAGCC CTGGTCCTCC TGTCTCCATC GTCACGTGGG CACACGTGGC TTTTCGCTCA GGACGTCGAG 13090 
TGGACACGGT GATCTCTGCC TCTGCTCTCC CTCCTGTCCA GTTTGCATAA ACTTACGAGG TTCACCTTCA 13160 
CGTTTTGATG GACACGCGGT TTCCAGGCGC CGAGGCCAGA GCAGTGAACA GAGGAGGCTG GGCGCGGCAG 13230 
TGGAGCCGGG TTGCCGGCAA TGGGGAGAAG TGTCTGGAAG CACAGACGCT CTGGCGAGGG TGCCTGCAGG 13300 
TTACCTATAA TCCTCTTCGC AATTTCAAGG GTGGGAATGA GAGGTGGGGA CGAGAACCCC CTCTTCCTGG 13370 
GGGTGGGAGG TAAGGGTTTT GCAGGTGCAC GTGGTCAGCC AATATGCAGG TTTGTGTTTA AGATTTAATT 134 40 
GTGTGTTGAC GGCCAGGTGC GGTGGCTCAC GCCGGTAATC CCAGCACTTT GGGAAGCTGA GGCAGGTGGA 13510 
TCACCTGAGG TCAGGAGTTT GAGACCAGCC TGACCAACAT GGTGAAACCC TATCTGTACT AAAAATACAA 13580 
AAATTAGCTG GGCATGGTGG TGTGTGCCTG TAATCCCAGC TACTTGGGAG GCTGAGGCAG GAGAATCACT 13650 
TGAACCCAGG AGGCGGAGGC TGCAGTGAGC TGAGATTGTG CCATTGTACT CCAGCCTGGG CGACAAGAGT 13720 
GAAACTCTGT CTTTAAAAAA AAAAAGTGTT CGTTGATTGT GCCAGGACAG G3TAGAGGGA GGGAGATAAG 13790 
ACTGTTCTCC AGCACAGATC CTGGTCCCAT CTTTAGGTAT GAAGAGGGCC ACATGGGAGC AGAGGACAGC 13860 
AGATGGCTCC ACCTGCTGAG GAAGGGACAG TGTTTGTGGG TGTTCAGGGG ATGGTGCTGC TGGGCCCTGC 13930 
CGTGTCCCCA CCCTGTTTTT CTGGATTTGA TGTTGAGGAA CCTCCGCTCC AGCCCCCTTT TGGCTCCCAG 14000 
TGCTCCCAGG CCCTACCGTG GCAGCTAGAA GAAGTCCCGA TTTCACCCCC TCCCCACAAA CTCCCAAGAC 14070 
ATGTAAGACT TCCGGCCATG CAGACAAGGA GGGTGACCTT CTTGGGGCTC TTTTTTTTCT TTTTTTCTTT 14140 
TTATGGTGGC AAAAGTCATA TAACATGAGA TTGGCACTCC TAACACCGTT TTCTGTGTAC AGTGCAGAAT 14210 
TGCTAACTCG GCGGTGTTTA CAGCAGGTTG CTTGAAATGC TGCGTCTTGC GTGACTGGAA GTCCCTACCC 14280 
ATCGAACGGC AGCTGCCTCA CACCTGCTGC GGCTCAGGTG GACCACGCCG AGTCAGATAA GCGTCATGCA 14 350 
ACCCAGTTTT GCTTTTTGTG CTCCAGCTTC CTTCGTTGAG GAGAGTTTGA CTTCTCTGAT CAGGACTCTG 14420 
CCTGTCATTG CTGTTCTCTG ACTTCAGATG AGGTCACAAT CTGCCCCTGG CTTATGCAGG GAGTGAGGCG 14490 
TGGTCCCCGG GTGTCCCTGT CACGTGCAGG GTGAGTGAGG CGTTGCCCCC AGGTGTCCCT CTCACGTGTA 14 560 
GGGTGAGTGA GGCGCGGCCC CCGGGTGTCC CTGTCCCGTG CAGCGTGATT GAGGTGTGGC CCCCGGGTGT 14 630 
CCCTGTCACG TGTAGGGTGA GTGAGGCGCC ATCCCCGGGT GTCCCTGTCA CGTGTAGGGT GAGTGAGGCG 14700 
TGGTCCCCGG GTGTCCCTGT CCCGTGCAGG GTGAGTGAGG CACTGTCCCC GGGTGTCCCT GTCACGTGCA 14770 
GGGTGAGTGA GGCGCGGTCC CCGGGTGTCC CTCTCAGGTG TAGGCTGAGT GAGGCGCGGC CCCAGGGTGT 14840 
CCCTGTCACG TGTAGGGTGA GTGAGGCACC GTCCCTGGGT GTCCCTCCCA GGTATAGGGT GAGTGAGGCA 14910 
CTGTCCCCGG GTGTCCCTGT CACGTGCAGG GTGAGTGAGG CGCGGCCCCC GGGTGTCCCT CTCAGGTGCA 14980 
GGGTGAGTGA GGCGCTGTCC CTGGGTGTCC CTGTCTCGTG TAGGGTGAGT GAGGCTCTGT CCCCAGGTGT 15050 
CCTTGGCGTT TGCTCACTTG AGCTTGCTCC TGAATGTTTG CTCTTTCTAT AGCCACAGCT GCGCCGGTTG 15120 
CCCATTGCCT GGGTAGATGG TGCAGGCGCA GTGCTGGTCC CCAAGCCTAT CTTTTCTGAT GCTCGGCTCT 15190 
TCTTGGTCAC CTCTCCGTTC CATTTTGCTA CGGGGACACG GGACTGCAGG CTCTCGCCTC CCGCGTGCCA 15260 
GGCACTGCAG CCACAGCTTC AGGTCCGCTT. GCCTCTGTTG GGCCTGGCTT GCTCACCACG TGCCCGCCAC 15330 
ATGCATGCTG CCAATACTCC TCTCCCAGCT TGTCTCATGC CGAGGCTGGA CTCTGGGCTG CCTGTGTCTG 15400 
CTGCCACGTG TTGCTGGAGA CATCCCAGAA AGGGTTCTCT GTGCCCTGAA GGAAAGCAAG TCACCCCAGC 15470 
CCCCTCACTT GTCCTGTTTT CTCCCAAGCT GCCCCTCTGC TTGGCCCCCT TGGGTGGGTG GCAACGCTTG 15540 
TCACCTTATT CTGGGCACCT GCCGCTCATT GCTTAGGCTG GGCTCTGCCT CCAGTCGCCC CCTCACATGG 15610 
ATTGACGTCC AGCCACAGGT TGGAGTGTCT CTGTCTGTCT CCTGCTCTGA GACCCACGTG GAGGGCCGGT 15680 
GTCTCCGCCA GCCTTCGTCA GACTTCCCTC TTCGGTCTTA GTTTTGAATT TCACTGATTT ACCTCTGACG 15750 
TTTCTATCTC TCCATTGTAT GCTTTTTCTT GGTTTATTCT TTCATTCCTT TTCTAGCTTC TTAGTTTAGT 15820 
CATGCCTTTC CCTCTAAGTG CTGCCTTACC TGCACCCTGT GTTTTGATGT GAAGTAATCT CAACATCAGC 15890 
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CACTTTCAAG TGTTCTTAAA ATACTTCAAA GTGTTAATAC TTCTTTTAAG TATTCTTATT CTGTGATTTT 15960 
TTTCTTTGTG CACGCTGTGT TTTGACGTGA AATCATTTTG ATATCAGTGA CTTTTAAGTA TTCTTTAGCT 16030 
TATTCTGTGA TTTCTTTGAG CAGTGAGTTA TTTGAACACT GTTTATGTTC AAGATATGTA GAGTATCAAG 16100 
ATACGTAGAG TATTTTAAGT TATCATTTTA TTATTGATTT CTAACTCAGT TGTGTAGTGG TCTGTATAAT 16170 
ACCAATTATT TGAAGTTTGC GGAGCCTTGC TTTGTGATCT AGTGTGTGCA TGGTTTCCAG AACTGTCCAT 16240 
TGTAAATTTG ACATCCTGTC AATAGTGGGC ATGCATGTTC ACTATATCCA GCTTATTAAG GTCCAGTGCA 16310 
AAGCTTCTGT CTCCTTCTAG ATGCATGAAA TTCCAAGAAG GAGGCCATAG TCCCTCACCT GGGGGATGGG 16360 
TCTCTTCATT TCTTCTCGTT TGGTAGCATT TATGTGAGGC ATTGTTAGGT GCATGCACGT GGTAGAATTT 164 50 
TTATCTTCCT GATGAGTGAA TCTTTTGGAG ACTTCTATGT CTCTAGTAAT CTAGTAATTC TTTTTTTAAA 16520 
TTGCTCTTAG TACTGCCACA CTGGGCTTCT TTTGATTAGT ATTTTCCTGC TGTGTCTGTT TTCTGCCTTT 16590 
AATTTATATA TATATATATA tTTTTTTTTT TTTTGAGACA GAGTCTTGGT CTGTCGCCCA GGGTGAGTGC 16660 
AGTGGTGTGA TCACAGGTCA GTGTAACTTT TACCTTCTGG CCTGAGCCGT CCTCTCACCT CAGCCTCCTG 16730 
AGTAGCTGGA ACTGCAGACA CGCACCGCTA CACCTGGCTA ATTTTTAAAT TTTTTCTGGA GACAGGGTCT 16800 
TGCTGTGTTG CCCAGGCTGG TCTCAAACTC TTGGACTCAA GGGATCCATC TACCTCGGCT TCCCAAAGTG 16870 
CTGAATTACA GGCATGAGCC ACCATGTCTG GCCTAATTTT CAACACTTTT ATATTCTTAT AGTGTGGGTA 16940 
TGTCCTGTTA ACAGCATGTA GGTGAATTTC CAATCCAGTC TGACAGTCGT TGTTTAACTG GATAACCTGA 17010 
TTTATTTTCA TTTTTTTGTC ACTAGAGACC CGCCTGGTGC ACTCTGATTC TCCACTTGCC TGTTGCATGT 17080 
CCTCGTTCCC TTGTTTCTCA CCACCTCTTG GGTTGCCATG TGCGTTTCCT GCCGAGTGTG TGTTGATCCT 17150 
CTCGTTGCCT CCTGGTCACT GGGCATTTGC TTTTATTTCT CTTTGCTTAG TGTTACCCCC TGATCTTTTT 17220 
ATTGTCGTTG TTTGCTTTTG TTTATTGAGA CAGTCTCACT CTGTCACCCA GGCTGGAGTG TAATGGCACA 17290 
ATCTCGGCTC ACTGCAACCT CTGCCTCCTC GGTTCAAGCA GTTCTCATTC CTCAACCTCA TGAGTAGCTG 17360 
GGATTACAGG CGCCCACCAC CACGCCTGGC TAATTTTTGT ATTTTTAGTA GAGATAGGCT TTCACCATGT 174 30 
TGGCCAGGCT GGTCTCAAAC TCCTGACCTC AAGTGATCTG CCCGCCTTGG CCTCCCACAG TGCTGGGATT 17500 
ACAGGTGCAA GCCACCGTGC CCGGCATACC TTGATCTTTT AAAATGAAGT CTGAAACATT GCTACCCTTG 17570 
TCCTGAGCAA TAAGACCCTT AGTGTATTTT AGCTCTGGCC ACCCCCCAGC CTGTGTGCTG TTTTCCCTGC 17640 
TGACTTAGTT CTATCTCAGG CATCTTGACA CCCCCACAAG CTAAGCATTA TTAATATTGT TTTCCGTGTT 17710 
GAGTGTTTCT GTAGCTTTGC CCCCGCCCTG CTTTTCCTCC TTTGTTCCCC GTCTGTCTTC TGTCTCAGGC 17780 
CCGCCGTCTG GGGTCCCCTT CCTTGTCCTT TGCGTGGTTC TTCTGTCTTG TTATTGCTGG TAAACCCCAG 17850 
CTTTACCTGT GCTGGCCTCC ATGGCATCTA GCGACGTCCG GGGACCTCTG CTTATGATGC ACAGATGAAG 17 920 
ATGTGGAGAC TCACGAGGAG GGCGGTCATC TTGGCCCGTG AGTGTCTGGA GCACCACGTG GCCAGCGTTC 17 990 
CTTAGCCAGT GAGTGACAGC AACGTCCGCT CGGCCTGGGT TCAGCCTGGA AAACCCCAGG CATGTCGGGG 18060 
TCTGGTGGCT CCGCGGTGTC GAGTTTGAAA TCGCGCAAAC CTGCGGTGTG GCGCCAGCTC TGACGGTGCT 18130 
GCCTGGCGGG GGAGTGTCTG CTTCCTCCCT TCTGCTTGGG AACCAGGACA AAGGATGAGG CTCCGAGCCG 18200 
TTGTCGCCCA ACAGGAGCAT GACGTGAGCC ATGTGGATAA TTTTAAAATT TCTAGGCTGG GCGCGGTGGC 18270 
TCACGCCTGT AATCCCAGCA CTTTGGGAGG CCAAGGCGGG TGGATCACGA GGTCAGGAGG TCGAGACCAT 18340 
CCTGGCCAAC ATGATGAAAC CCCATCTGTA CTAAAAACAC AAAAATTAGC TGGGCGTGGT GGCGGGTGCC 18410 
TGTAATCCCA GCTACTCGGG AGGCTGAGGC AGGAGAATTG CTTGAACCTG GGAGTTGGAA GTTGCAGTGA 18480 
GCCGACATTG CACCACTGCA CTCCAGCCTG GCAACACAGC GAGACTCTGT CTCAAAAAAA AAAAAAAAAA 18550 
AAAAAAAAAA AATTCTAGTA GCCACATTAA AAAAGTAAAA AAGAAAAGGT GAAATTAATG TAATAATAGA 18620 
TTTTACTGAA GCCCAGCATG TCCACACCTC ATCATTTTAG GGTGTTATTG GTGGGAGCAT CACTCACAGG 18690 
ACATTTGACA TTTTTTGACC TTTGTCTGCG GGATCCCGTG TGTAGGTCCC GTGCGTGGCC ATCTCGGCCT 18760 
GGACCTGCTG GGCTTCCCAT GGCCATGGCT GTTGTACCAG ATGGTGCAGG TCCGGGATGA GGTCGCCAGG 18630 
CCCTCAGTGA GCTGGATGTG CAGTGTCCGG ATGGTGCACG TCTGGGATGA GGTCGCCAGG CCCTGCTGTG 18900 
AGCTGGATGT GTGGTGTCTG GATGGTGCAG GTCAGGGGTG AGGTCTCCAG GCCCTCGGTG AGCTGGAGGT 18970 
ATGGAGTCCG GATGATGCAG GTCCGGGGTG AGGTCGCCAG GCCCTGCTGT GAGCTGGATG TGTGGTGTCT 19040 
GGATGGTGCA GGTCAGGGGT GAGGTCTCCA GGCCCTCGGT AAGCTGGAGG TATGGAGTCC GGATGATGCA 19110 
GGTCCGGGGT GAGGTCGCCA GGCCCTGCTG TGAGCTGGAT GTGTGGTGTC TGGATGGTGC AGGTCTGGGG 19180 
TGAGGTCACC AGGCCCTGCG GTGAGCTGGG TGTGCGGTGT CTGGATGGTG CAGGTCTGGA GTGAGGTCGC 19250 
CAGACGGTGC CAGACCATGC GGTGAGCTGG ATATGCGGTG TCCGGATGGT GCAGGTCTGG GGTGAGGTTG 19320 
CCAGGCCCTG CTGTGAGTTG GATGTGGGGT GTCCGGATGC TGCAGGTCCG GTGTGAGGTC ACCAGGCCCT 19390 
GCTGTGAGCT GGATGTGTGG TGTCTGGATG GTGCAGGTCT GGGGTGAAGG TCGCCAGGCC CCTGCTTGTG 194 60 
AGCTGGATGT GTGGTGTCTG GATGGTGCAG GTCTGGAGTG AGGTCGCCAG GCCCTCGGTG AGCTGGATGT 19530 
GCAGTGTCCA GATGGTGCAG GTCCGGGGTG AGGTCGCCAG ACCCTGCGGT GAGCTGGATG TGCGGTGTCT 19600 
GGATGGTGCA GGTCTGGAGT GAGGTCGCCA GGCCCTCGGT GAGCTGGATG TATGGAGTCC GGATGGTGCC 19670 
GGTCCGGGGT GAGGTCGCCA GACCCTGCTG TGAGCTGGAT GTGCGGTGTC TGGATGGTAC AGGTCTGGAG 19740 
TGAGGTCGCC AGACCCTGCT GTGAGCTGGA TATGCGGTGT CCGGATGGTG CAGGTCAGGG GTGAGGTCTC 19810 
CAGGCCCTCG GTGAGCTGGA GGTATGGAGT CCGGATGATG CAGGTCCGGG GTGAGGTCGC CAGGCCCTGC 19880 
TGTGAACTGG ATGTGCGGCG TCTGGATGGT GCAGGTCTGG GGTGTGGTCG CCAGGCCCTC GGTGAGCTGG 19950 
AGGTATGGAG TCCGGATGAT GCAGGTCCGG GGTGAGGTCG CCAGGCCCTG CTGTGAGCTG GATGTGCGGC 20020 
GTCTGGATGG TGCAGGTCTG GGGTGTGGTC GCCAGGCCCT CGGTGAGCTG GAGGTATGGA GTCCGGATGA 20090 
TGCAGGTCCG GGGTGAGGTT GCCAGGCCCT GCTGTGAGCT GGATGTGCTG TATCCGGATG GTGCAGTCCG 20160 
GGGTGAGGTC GCCAGGCCCT GCTGTGAGCT GGATGTGCTG TATCCGGATG GTGCAGGTCT GGGGTGAGGT 20230 
CACCAGGCCC TGCGGTGAGC TGGTTGTGCG GTGTCCGGTT GCTGCAGGTC CGGGGTGAGT TCGCCAGGCC 20300 
CTCGGTGAGC TGGATGTGCG GTGTCCCCGT GTCCGGATGG TGCAGGTCCA GGGTGAGGTC GCTAGGCCCT 20370 
TGGTGGGCTG GATGTGCCGT GTCCGGATGG TGCAGGTCTG GGGTGAGGTC GCCAGGCCTT TGGTGAGCTG 204 40 
GATGTGCGGT GTCTGCATGG TGCAGGTCTG GGGTGAGGTC GCCAGGCCCT TGGTGGGCTG GATGTGTGGT 20510 
GTCCGGATGG TGCAGGTCCG GCGTGAGGTC GCCAGGCCCT GCTGTGAGCT GGATGTGCGG TGTCTGGATG 20530 
GTGCAGGTCC GGGGTGAGGT AGCCAAGGCC TTCGGTGAGC TGGATGTGGG GTGTCCGGAT GGTGCAGGTC 20650 
CGGGGTGAGG TCGCCAGGCC CTGCGGTTAG CTGGATATGC GGTGTCCGGA TGGTGCAGGT CCGGGGTGAG 20720 
GTCACCAGGC CCTGCGGTTA GCTGGATGTG CGGTGTCTGG ATGGTGCAGG TCCGGGGTGA GGTCGCCAGG 20790 
CCCTGCTGTG AGCTGGATGT GCTGTATCCG GATGGTGCAG GTCCGGGGTG AGGTCGCCAG GCCCTGCAGT 20860 
GAGCTGGATG TGCTGTATCC GGATGGTGCA GGTCTGGCGT GAGGTCGCCA GGCCCTGCGG TTAGCTCGAT 20930 
ATGCGGTGTC GGATGGTGCA GGTCCGGGGT GAGGTCACCA GGCCCTGCGG TTAGCTGGAT GTGCGGTGTC 21000 
CGGATGGTGC AGGTCTGGGG TGAGGTCGCC AGGCCCTGCT GTGAGCTGGA TGTGCTGTAT CCGGATGGTG 21070 
CAGGTCCGGG GTGAGGTCGC CAGGCCCTGC GGTGAGCTGG ATGTGCTGTA TCCGGATGGT GCAGGTCTGG 21140 
CGTGAGGTCG CCAGGCCCTG CGGTGAGCTG GATGTGCAGT GTACGGATGG TGCAGGTCCG GGGTGAGGTC 21210 
GCCAGGCCCT GCGGTGGGCT GTATGTGTGT TGTCTGGATG GTGCAGGTCC GGGGTGAGTT CGCCAGGCCC 21280 



WO 99/33998 



PCT/EP98/08216 



30 



TGCGGTGAGC TGGATGTGTG GTGTCTGGAT GCTGCAGGTC 
TGGATATGCG GTGTCCCCGT GTCCGAATGG TGCAGGTCCA 
GATGTGCCGT GTCCGGATGG TGCAGGTCTG GGGTGAGGTC 
GTCCGGATGG TGCAGGTCCG GGGTGAGGTC ACCAGGCCCT 
TTTAAGGGGT TGGCTGTGTT CCGGCCGCAG AGCACCGTCT 
CTGGCTGATG AGTGTGTACG TCGTCGAGCT GCTCAGGTCT 
AAGAACAGGC TCTTTTTCTA CCGGAAGAGT GTCTGGAGCA 
TCCCCACGCC AGGCCTCTGC TTCTCGAAGT CCTGGAACAC 
CTTGCCTGTG CTTCCCTGGC TGTGCAGCTC TGGGCTGGGA 
GTGGATTCTG TGCAAGGCTC TGACTGCCTG GAGCTCACGT 
CAAGTGGTCT CTAGGGTTTG TAAAGCAGAA GGGATTTAAA 
GCCTTTCCCT GGGATGTGGG TCTGATTCTC TCTCTCTTTT 
TGTTGCCCAG GCTGGAGTGC AGTGGCATAA TCTTGGCTCA 
TTCACCAGCC TCAGCCTCCT AAGTAGCTGG GATTACAGGC 
CTTTTAGGAG AGACGGGGTT TCACCATGTT GGCCAGGCTG 
CCACCTTGGC CTCCCAAAGT GCTGGGTTTA CAGGCTAAGC 
TTCATGCTGT TCTGTATGAA TCTTCAATCT ATTGGATTTA 
GGCGACTCAC TGCAGGGAGC ACCTGTGCAG GGAGCACCTG 
TCTAGGTGGC TGCATTTGAA TGGCTGTGAG ATTTTGTCTG 
TGACAGATTC AAGCTGGATT TGCATCAGTG AGGGACGGGA 
AGCCCAGGCC ATGGTATTAG CTTCTCCGTG TCCCGCCCAG 
CAGGGCTTCC CCAGCTCCCC TGCACACTCG AGTCCCTGGG 
GGATGTCTGC AGAGGGAGCT GGCAGCAGAC CTCGTCAGAG 
CGTGGTGCTG GGGCCATTTC CTTGCATCTG GGGGAGGGTC 
ACAATGCACC TTACTTAGAC TTTACACGTA TTTAATGGTG 
TTTGGAAAGA ATTTAATTGG GGTGACCGGA AGGAGCAGAC 
CACTACTGGG ACTGTTGTTC TGCCTGGGGG GCCTTGGAGG 
TTTCTACTCT GCTGGGCCTG CGGCCTGCGG TCAGGGCACC 
ACGGAGTGCC AGGCTGTCAG CCACAGATGC CCAGGTCCAG 
GGGTGGTTTT GGGGGAAAAG GCCAAGGGCA GAGGTGTCAG 
GCTCCTTGGC TGAGCTGCCC TGAGCAGCCT CTCCCGCCCT 
CTGGGGGTCC TGCCTGGGGC CAGCCTTGGG CTACCCCAGT 
GGAGGGGCAT GGGTTCACGT GGCCCCAGAT GCAGCCTGGG 
GTCACCCTGG GGGTTGACCG CCGGACTGGG CGTCCCCAGG 
CTGCAAGTAG AGGGGCTCTC AGAGGCGTCT GGCTGGCATG 
CGTGTGCTGC CGTGGGTGCC CTGAGCCCTC ACTGAGTCGG 
CCTAGTCTGT TGTCTGGCTG AGCAAGCCTC CTGAGGGGCT 
CAGCTGCGGG AGCTGTCGGA AGCAGAGGTC AGCCAGCATC 
GACTCCGCTT CATCCCCAAG CCTGACGGGC TGCGGCCGAT 
AACGTTCCGC AGAGAAAAGA GGGTGGCTGT GCTTTGGTTT 
GCCCCACATT TGGTATCAGC TTAGATGAAG GGCCCGGAGG 
CACGGCGCCA ACCCATTTGT GCGCACAGTG AGGTGGCCGA 
GGGTGTAGGG GGAGCTCCTG GGGCAGGGAC AGGCTCTGAG 
GATGCAGCAC GGCCCGAGGT CCTGGATCCG TGTCCTGCTG 
CGGGGCCCGG GGACCAGGCC ACGACTGCCA GGAGCCCACC 
GGCTCCTGCA CCCCACCCCT GTGGCTGCGG TGGCTGCGGT 
AGGTGGACAG AGGTGTGGCA TGAGGATCCC GTGTGCAACA 
GGTCTGAGGA AGCTGGGAGG GGTTCTAGGT CCCGGGTCTG 
TCTCCCCTGG GTCCCTATGG TGGGGTGGGC ACTTGGCCGG 
CCCCGCCAGG CCGAGCGTCT CACCTCGAGG GTGAAGGCAC 
GGCGCCCCGG CCTCCTGGGC GCCTCTGTGC TGGGCCTGGA 
GCTGCGTGTG CGGGCCCAGG ACCCGCCGCC TGAGCTCTAC 
GAGCAGCCCT GCTGGACCTT GGGAGTGGCT GCCTGATTGG 
GGGTGGGCCG CAGGGAGTGC AGGTGACCCT GTCACTGTTG 
TTCAGCCTTT CCTGCAGCAC ATGGGGCCGA CTGTGCACCC 
GTCCCACTGG ATTCCAGTTT CCGTCAGAGA AGGAACCGCA 
CACCCCAGTC CTGAGCCAGG GGTCTCCTGT CCTGAGGCTC 
GGGTCTGGAG TGGTGGGGGT CAGAGAGAGA GTGGGGGACA 
ATGTCTGAGT TTCTGCGTGG CCACTGTCAG TCTCCTCGCC 
GTACGACACC ATCCCCCAGG ACAGGCTCAC GGAGGTCATC 
TGCGTGCGTC GGTATGCCGT GGTCCAGAAG GCCGCCCATG 
TAAGGTTCAC GTGTGATAGT CGTGTCCAGG ATGTGTGTCT 
GTGTCTGTGA TGCGTTTCTG TGGTGGAGGT ACTTCCATGA 
CGTGTGTGTC GTGGTGCATG TATCTGTGGC GTGCATATTT 
CCATGGTGTG TGTGCCTGTG GTGTGCATGT GTGTGTGTCT 
CATGTCTGTG ATGTGCCTAT TTGTGGTGTG TGTGTGCATG 
GGTGTGTGTG GCCCCTTGGC CTTACTCCTT CCTCCTCCAG 
CGGGTGCTGG TTTGGGGAGC TCCACATTCA GGGTCCTCAC 
GGGCTGGGCC TTGGAGACTG TAAGCCAGGT TTGAGAGGAG 
CCCTGGCACC CCCAGGACCC CAGTCTGGCC TATGCCGGCT 
TCGCTCCCCG GGACACACTC CTCCCAGAGC GGCCGGGGGC 
TGGGCTTGGG TTCCCACCCA GTGGTCATGA GCACGCTGGA 
GGGTGCAGAG GTGAAGAAGT ATCCCTGGAG CTTCGGTCTG 
CCTCTTTCTC TGACTTCTTG AGCT 



CGGGCTGACT TCGCCAGGCC CTCGGTGAGC 213SO 
GGGTGAGGTC GCCAGGCCCT TGGTGGGCTG 21420 
GCCAGGCCCT TGGTGAGCTG GATGTGCGGT 21490 
CGGTGATCTG GATGTGGCAT GTCCTTCTCG 21560 
GCGTGAGGAG ATCCTGGCCA AGTTCCTGCA 21630 
TTCTTTTATG TCACGGAGAC CACGTTTCAA 21700 
AGTTGCAAAG CATTGGAATC AGGTACTGTA 21770 
CAGCCCGGCC TCAGCATGCG CCTGTCTCCA 21840 
GCCAGGGGCC CCGTCACAGG CCTGGTCCAA 21910 
TCTCTTACTT GTAAAATCAG GAGTTTGTGC 21980 
TTAGATGGAA ACACTACCAC TAGCCTCCTT 22050 
TTTTTTCTTT TTTGAGATGG AGTCTCACTC 22120 
CTGCAACCTC CACCTCCTGG GTTTAAGCGA 22190 
ACCTGCCACC ACGCCTGGCT AATTTTTGTA 222 60 
GTCTCGAACT CATGACCTCA GGTGATCCAC 22330 
CACCGTGCCC AGCCCCCGAT TCTCTTTTAA 22400 
GGTCATGAGA GGATAAAATC CCACCCACTT 22470 
GGGATAGGAG AGTTCCACCA TGAGCTAACT 22540 
CAATGTTCGG CTGATGAGAG TGTGAGATTG 22610 
GCGCTGGTCT GGGAGATGCC AGCCTGGCTG 22680 
GCTGACTGTG GAGGGCTTTA GTCAGAAGAT 22750 
GGGCCTTGTG ACACCCCATG CCCCAAATCA 22820 
GTAACACAGC CTCTGGGCTG GGGACCCCGA 22890 
AGGGCTTTCC CTGTGGGAAC AAGTTAATAC 22960 
TGCGACCCAA CATGGTCATT TGACCAGTAT 23030 
AGACGTGGTG GTCCCCAAGA TGCTCCTTGT 2 3100 
CCCCTCCTCC CTGGACAGGG TACCGTGCCT 23170 
AGCTCCGGAG CACCCGCGGC CCCAGTGTCC 23240 
GTCTGGCCGC TCCAGCCCCC GTGCCCCCAT 23310 
GAGACTGGTG GGCTCATGAG AGCTGATTCT 23380 
CTCCATCTGA AGGGATGTGG CTCTTTCTAC 234 50 
GGCTGTACCA GAGGGACAGG CATCCTGTGT 23520 
ACCAGGCTCC CTGGTGCTGA TGGTGGGACA 23590 
GTTGACTATA GGACCAGGTG TCCAGGTGCC 23660 
GGTGGACGTG GCCCCGGGCA TGGCCTTCAG 23730 
TGGGGGCTTG TGGCTTCCCG TGAGCTTCCC 23800 
CTCTATTGCA GACAGCACTT GAAGAGGGTG 23870 
GGGAAGCCAG GCCCGCCCTG CTGACGTCCA 23940 
TGTGAACATG GACTACGTCG TGGGAGCCAG 24010 
AACTTCCTTT TTAAACAGAA GTGCGTTTGA 24080 
AGGGGCCACG GGACACAGCC AGGGCCATGG 2 4L50 
GGTGCCGGTG CCTCCAGAAA AGCAGCGTGG 24220 
GACCACAAGA AGCAGCCGGG CCAGGGCCTG 24290 
TGGTGCGCAG CCTCCGTGCG CTTCCGCTTA 24360 
GGGCTCTGAG GATCCTGGAC CTTGCCCCAC 24430 
GACCCCGTCA TCTGAGCAGA GTGTGGGGTG 24500 
CACATGCGGC CAGGAACCCG TTTCAAACAG 24570 
GGTGGCTGGG GACACTGGGG AGGGGCTGCT 2 4 640 
ATCCACTTTC CTGACTGTCT CCCATGCTGT 24710 
TGTTCAGCGT GCTCAACTAC GAGCGGGCGC 247 80 
CGATATCCAC AGGGCCTGGC GCACCTTCGT 24850 
TTTGTCAAGG TGGGTGCCGG GGACCCCCGT 24920 
CACCTCATGT TGGGTGGAGG AGGTACTCCT 24990 
AGGACACACC TGGCACCTAG GGTGGAGGCC 25060 
TGACTGCCCG GGCTCCTATT CCCAAGGAGG 25130 
ACGGCTCAGC CACCAGGCCC CGGTGCCTTG 25200 
AGAGAGGGGA CACAGCCCGC CCTGCCCTTG 2S270 
CCGCCAGGCC AGGCCCTGAG GGCAGAGGTG 25340 
TCCACTCACA CAGGTGGATG TGACGGGCGC 25410 
GCCAGCATCA TCAAACCCCA GAACACGTAC 25480 
GGCACGTCCG CAAGGCCTTC AAGAGCCACG 25550 
CTGGGATATG AATGTGTCTA GAATGCAGTC 25620 
TTTACACATC TGTGATATGC GTGTGTGGCA 25690 
GTGGTGTGTG TGTGTGTGGC ACGTGTGTGT 25760 
GTGACACGTG CATGTTCATG CTGTGTGCTG 25830 
TGTCCGTGAC ATATGCGTGT CTATGGCATG 25900 
GCATGGTCCG CACCATTGTC CTCACGC7CT 25970 
TTCTAGCATG GGTGCCCCTG TCCTGTCACA 26040 
AGTAGGGATG CTGGTGGTAC CTTCCTGGAC 26110 
CCATGAGATA TAGGAAGGCT GATTCAGGCC 26180 
CTTGGGGCTC GGCAGGGGTG AAAGGGGCCC 26250 
GGGGTAAGCC CTCAAAGTCG TGCCAGGCCG 26320 
GGGAGAGGCA CATGTGGAAA CCCACAAGGA 26390 

26414 
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Contig 2: 

TGTGGGATTG GTTTTCATGT GTGGGATAGG TGGGGATCTG TGGGATTGGT TTTTATGAGT GGGGTAACAC 70 
AGAGTTCAAG GCGAGCTTTC TTCCTGTAGT GGGTCTGCAG GTGCTCCAAC AGCTTTATTG AGGAGACCAT 140 
ATCTTCCTTT GAACTATGGT CGGGTTTATA GTAAGTCAGG GGTGTGGAGG CCTCCCCTGG GCTCCCTGTT 210 
CTGTTTCTTC CACTCTGGGG TCGTGTGGTG CCTGCTGTGG TGTGTGGCCG GTGGGCAGGG CTTCCAGGCC 280 
TCCTTGTGTT CATTGGCCTG GATGTGGCCC TGGCTACGCT CCGTCCTTGG AATTCCCCTG CGAGTTGGAG 350 
GCTTTCTTTC TTTCTTTTTT TCTTTCTTTT TTTTTTTTTT TGATAACAGA GTCTCGCTCT TTTTTGCCCA 4 20 
GGCTGGAGTG GTTTGGCGTG ATCTTGGCTC ACTGCAACCT GTGCTTCCTG AGTTCAAGCA ATTCTCTTGC 4 90 
CTCAGCCTCC CAAGTAGCTG GAATTATAGG CGCCCACCAC CATGCTGACT AATTTTTGTA ATTTTAGTAG 560 
AGACGAGGTT TCTCCATGTT GGCCAGGCTG GTCTCGAACT CCTGACCTCA GGTGATCCTC CCACCTCGGC 630 
CTCCCAAAGT GCTGGGATGA CAGGTGTGAA CCGCCGCGCC CGGCCGAGAC TCGCTTCCTG CAGCTTCCGT 700 
GAGATCTGCA GCGATAGCTG CCTGCAGCCT TGGTGCTGAC AACCTCCGTT TTCCTTCTCC AGGTCTCGCT 770 
AGGGGTCTTT CCATTTCATG ACTCTCTTCA CAGAAGAGTT TCACGTGTGC TGATTTCCCG GCTGTTTCCT 840 
GCGTAATTGG TGTCTGCTGT TTATCGATGG CCTCCTTCCA TTTCCTTTAG GCTTTGTTTA TTGTTGTTTT 910 
TCCGGCTCCT TGAAGGAAAA GTTTCGATTA TGGATGTTTG AACTTTCTTT TCTAAACAAG CATCTGAAGT 980 
TGCCGTTTTC CCTCTAAAGC AGGGATCCCG AGGCCCCTGG CTGTGGAGTG GCACCGGTCT GGGGCCTGTT 1050 
AGGAACCCGG CGCACAGCGG GAGGCTAGGT GGGGTGTGGG GAGCCAGCGT TCCCGCCTGA GCCCCGCCCC 1120 
TCTCAGATCA GCAGTGGCAT GCGGTGCTCA GAGGCGCACA CACCCTACTG AGAACTGTGC GTGAGAGGGG 1190 
TCTAGATTCT GTGCTCCTTA TGGGAATCTA ATGCCTGATG ATCTGAGGTG GAACCGTTTG CTCCCAAAAC 1260 
CATCCCCTTC CCCACTGCTG TCCTGTGGAA AAATCGTCTT CCACGAAACC AGTCCCTGGT ACCACAATGG 1330 
TTGGGGACCC TGTGCTAAAG ACCTGCTTCA GCAGCCTCTC GTCAGTGTTG ATATATTGGC TTTTCTGTGT 1400 
TGAGTCCAGA ATAATTACGG ATTTCTGTGA TGCTTTCCGC CGACCTCAGA CCCATGGGCT ATTTGTGGGC 1470 
GTGTTGCCTG CTCCTGGGTT GGGAAGGGTG CAGGCCCCAT GTACCTTCCT GTTACTGCCT TCCAGGTTGG 1540 
TTCTCAGGGT TGAATCGTAC TCGATGTGGT TTTAGCCCAC GGCCCTGCCG CCAGCTCCTG GGGGCTGGGG 1610 
AACATGCTGA AGCACAGAGT CACCGTGCGC GTCTTTTGAT GCCTCACAAG CTCGAGGCCT CCTGTGTCCG 1680 
TGTTAGTGTG TGTCACGTGC CTGCTCACAT CCTGTCTTGG GGACGCAGGG GCTTAGCAGG TCCCGTAGTA 1750 
AATGACAAGC GTCCTGGGGG AGTCTGCAGA ATAGGAGGTG GGGGTGCCGG TCTCTCTCCC GCGTCTTCAG 1820 
ACTCTTCTCC TGCCTGTGCT GTGGCTGCAC CTGCATCCCT GCAATCCCTC CAGCACTGGG CTGGAGAGGC 1890 
CCGGGAGCTC GAGTGCCACT TGTGCCACGT GACTGTGGAT GGCAGTCGGT CACGGGGGTC TGATGTGTGG 1960 
TGACTGTGGA TGGCGGTTGG TCACAGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2030 
TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2100 
TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGGT GACTGTGGAT GGCGGTCGTG GGGTCTGATG 2170 
TGGTGACTGT GGATGGCAGT CGTGGGGTCT GATGTGTGGT GACTGTGGAT GGCGGTCGTG GGGTCTGATG 2240 
TGGTGACTGT GGATGGCAGT CGTGGGGTCT GATGTGTGGT GACTGTGGAT GGCGGTCGTG GGGTCTGATG 2310 
TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2380 
TGTGTGGTGA CTGTGGATGG CGGTCGTGGG GTCTGATGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2450 
TGTGTGGTGA CTGTGGATGG TGATCGGTCA CAGGGGTCTG ATGTGTGGTG ACTGTGGATG GCGGTCGTGG 2520 
GGTCTGATGT GTGGTGACTG TGGATGGTGA TCGGTCACAG GGGTCTGATG TGTGGTGACT GTGGATGGCG 2590 
GTCGTGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTTG GTCCCGGGGG TCTGATGTGT GGTGACTGTG 2660 
GATGGCGATC GGTCACAGGG GTCTGATGTG TGGTGACTGT GGATGGCGGT CGTGGGGTCT GATGTGTGGT 2730 
GACTGTGGAT GGCGGTCGTG GGGTCTGATG TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGGT 2800 
GACTGTGGAT GGCGGTCGTG GGGTCTGATG TGGTGACTGT GGATGGCGGT CGTGGGGTCT GATGTGTGGT 2870 
GACTGTGGAT GGCGGTTGGT CCCGGGGGTC TGATGTGTGG TGACTGTGGA TGGCGGTCGT GGGGTCTGAT 2940 
GTGGTGACTG TGGATGGCAG TCGTGGGGTC TGATGTGTGG TGACTGTGGA TGGCGGTCGT GGGGTCTGAT 3010 
GTGTGGTGAC TGTGGATGGC GGTCGTGGGG TCTGATGTGT GGTGACTGTG GATGGCGGTC GTGGGGTCTG 3080 
ATGTGTGGTG ACTGTGGATG GCGGTCGTGG GGTCTGATGT GGTGACTGTG GATGGCGGTC GTGGGGTCTG 3150 
ATGTGTGGTG ACTGTGGATG GTGATCGGTC ACAGGGGTCT GATGTGTGGT GACTGTGGAT GGCGGTCGTG 3220 
GGGTCTGATG TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGGT GACTGTGGAT GGCGGTCGTG 3290 
GGGTCTGATG TGTGGTGACT GTGGATGGCG GTCGTAGGGT CTGATGTGTG GTGACTGTGG ATGGCAGTCG 3360 
GTCACAGGGG TCTGATGTGT GGTGACTGTG GATGGCGGTC GTGGGGTCTG ATGTGTGGTG ACTGTGGATG 3430 
GCGGTCGTGG GGTCTGATGT GTGGTGACTG TGGATGGCGG TCGTGGGGTC TGATGTGTGG TGACTGTGGA 3500 
TGGCGGTCGT GGGGTCTGAT GTGGTGACTG TGGATGGTGA TCGGTCACAG GGGTCTGATG TGTGGTAGCT 3570 
GCAGGTGGAG TCCCAGGTGT GTCTGTAGCT ACTTTGCGTC CTCGGCCCCC CGGCCCCCGT TTCCCAAACA 3640 
GAAGCTTCCC AGGCGCTCTC TGGGCTTCAT CCCGCCATCG GGCTTGGCCG CAGGTCCACA CGTCCTGATC 3710 
GGAAGAAACA AGTGCCCAGC TCTCCCCGGG GCAGGCCACA TTTGTGGCTC ATGCCCTCTC CTCTGCCGGC 3780 
AGGTCTCTAC CTTGACAGAC CTCCAGCCGT ACATGCGACA GTTCGTGGCT CACCTGCAGG AGACCAGCCC 3850 
GCTGAGGGAT GCCGTCGTCA TCGAGCAGGT CTGGGCACTG CCCTGCAGGG TTGGGCACGG ACTCCCAGCA 3920 
GTGGGTCCTC CCCTGGGCAA TCACTGGGCT CATGACCGGA CAGACTGTTG GCCCTGGGGG GCAGTGGGGG 3990 
GAATGAGCTG TGATGGGGGC ATGATGAGCT GTGTGCCTTG GCGAAATCTG AGCTGGGCCA TGCCAGCCTG 4060 
CGACAGCTGC TGCATTCAGG CACCTGCTCA CGTTTGACTG CGCGGCCTCT CTCCAGTTCC GCAGTGCCTT 4130 
TGTTCATGAT TTGCTAAATG TCTTCTCTGC CAGTTTTGAT CTTGAGGCCA AAGGAAAGGT GTCCCCCTCC 4200 
TTTAGGAGGG CAGGCCATGT TTGAGCCGTG TCCTGCCCAG CTGGCCCCTC AGTGCTGGGT CTGAGGCCAA 4270 
AGGAAACGTG TCCCCCTTCT TAGGAGGACG GGCCGTGTTT GAGCCACGCC CCGCTGAGCG GGCCTCTCAG 4 340 
TGCTGGGTCT GTCCACGTGG CCCTGTGGCC CTTTGCAGAT GTGGTCTGTC CACGTGGCCC TGTGGCTCTT 4410 
TGCAGATGCC TGTTAGCACT TGCTCGGCTC TAGGGGACAG TCGTGTCCAC CGCATGAGGC TCAGAGACCT 4 480 
CTGGGCGAAT TTCCTTGGCT CCCAGGGTGG GGGTGGAGGT GGCCTGGGCT GCTGGGACCC AGACCCTGTG 4550 
CCCGGCAGCT GGGCAGCAAC TCCTGGATCA CATATGCCAT CCGGGCCACG GTGGGC7GTG TGGGTGTGAG 4620 
CCCAGCTGGA CCCACAGGTG GCCCAGAGGA GACGTTCTGT GTCACACACT CTGCCTAAGC CCATGTGTGT 4690 
CTGCAGAGAC TCGGCCCGGC CAGCCCACGA TGGCCCTGCA TTCCAGCCCA GCCCCGCACT TCATCACAAA 4760 
CACTGACCCC AAAAGGGACG GAGGGTCTTG GCCACGTGGT CCTGCCTGTC TCAGCACCCA CCGGCTCACT 4830 
CCCATGTGTC TCCCGTCTGC TTTCGCAGAG CTCCTCCCTG AATGAGGCCA GCAGTGGCCT CTTCGACGTC 4900 
TTCCTACGCT TCATGTGCCA CCACGCCGTG CGCATCAGGG GCAAGTGAGT CAGGTGGCCA GGTGCCATTG 4970 
CCCTGCGGGT GGCTGGGCGG GCTGGCAGGC CTTCTGCTCA CCTCTCTCCT GCCCCTTCCC CACTGNCCTT 5040 
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CTGCCCGGGG CCACCAGAGT CTCCTTTTCT GGCCCCCGCC 
GGCCCCGGAA ACATGGCTCG GCTTGCGGCA GCCGGAGCGG 
AAGCGGGGTG TGGAGTTGCT CCTGCGTGGA GGACGAGGGG 
GAGCGTTTGA GCCTGCAGCT TGTCAGCTCC AAGTTACTAC 
GTATCTCTCT CTCCCGATAC AAAAGGATTT TATCCGATTC 
GAGGGCGCGG GCTCTTCTCT CTGTGACTAG ATTTCCCATC 
CTCCTCTCGG GGGGCCTGTG GTGGCCATGG GGCAGGCGGC 
GTGAGCCACA CTCACGGTGG TAGAGCCACA GTGCCTGGTG 
ACCACACACC TCCCGGCAGG CATCTGCCTG CGACCCTGTG 
AATTCGTGCA CACTCAAGGT CATCAGCAAG GTCATCCGCA 
GATCGTCTCC AGCGGATAAA GGACTGTGCA CAGCTTCGGA 
ATTGCATTAT AAGTAATCAC TAATGGTATC AGCAATTATA 
AGTAGTACAC ACGTTCTGGA AAAACACAAA TTGCACATGG 
TGTGCACATG TGTGTAAGCG GCCCCCAGGC CCACAGAATT 
ACCACGGGCC TCCTTCGTGG TCGTGAATTT TATTAAGATG 
GGGCTTTGGG GAATGTGAGG TGATGACTGC GTCCTCATGC 
CTGTCCCTAG GACACGGACA GGCCCGAAGC TCTAGTCCCC 
ACGTCTTCAA AACCTGTTGC CCCAAAAACT AAGAACAGAG 
CGTATCTGCT TGCGTTGACT CGCTGGGCTG GCCGGACTCC 
AGTGCAGTCC TCTTGCCCAT CACTGTGATA TCTGCACCAG 
TTTTTTTTTT GAGACGGAAC GTCACTGTTG TCTGCCTGGG 
TGCAACCTCC GCCTCCCGGG TTCCAGCATT TCTCCTGCCT 
CCCACCCCCT GCGCCTGGCT AATTTTTGTA TTTTTAGTAG 
GTCTCGAACT CCTGACCTCA GGTGATCCAC CCACCTCGGC 
CCATCACGCC CAGCCGGAAA GCCTCTTTTT AAGGTGACCA 
TGTTTTTGCA GTAGGCTGCA AGCGTCTCTT AGCAACAGGA 
AGGGTCGCGT GGCAGCCATG CCTTCTGTGT GCACCTTTAG 
TGTCTGAAAA CGCACCCTTG GCATCCTTGT TTGGAGAGTT 
GGGCAAGGTT GTATCCGTTG GCGCGCAGCG GCTACATGTA 
CCTTGAAAAA AAAAAAAGGA GTCCGGTTAA GCATTCATTC 
TCTAAGATTT AAGAAACCTT AATGAAAGAA AACCTTGATG 
GCTGGATCTG TTTCAGCCGC CCCAGTGCAT GGTGAGAGTG 
ATCTGGTATG TTTCTGAGGT GTTTGCCGGC TGAATGGTAG 
TCTGTGTGTG GCTCGGTTTG AGTGTACGCA TGTCCAGCAC 
CCGCCCCAGG TCCTACGTCC AGTGCCAGGG GATCCCGCAG 
CTGTGCTACG GCGACATGGA GAACAAGCTG TTTGCGGGGA 
CCAGGGGGGC TTGGGTGCGG GTTGATTTGC TTTTGATGCA 
ACCATGACTG CTCTGTCTTG AGGAACCAGA CAAGGTTGCA 
GGGTTGCACA GCCTGAGGAC TGCGGGCTCC ACGCAGGCTC 
GCTCAGCAGG CGGGAGGGCC GCTGCCCTGC ATGATGAGCA 
CTTCTGTCAC GTCACCCAGG TTCCGTTAGG GTCCTTGGGG 
ATCTCCCAGC AGGCCCTCGA CAGGTGGCCT GGACTGGGCG 
ATGGGGTCTA CACCCAAGGA CGCACACACC TAAATATCGT 
TTTTATTGAC AGCAGTTACT TTTTTTTTTT TAATACTTTA 
GTTAGTTACA TATGTATACA TGTGCCATGT TGGTGTGCTG 
TATCTCCTAA TGCTATCCCT CCCCACTCCC CCCATCCCAT 
CTGTGTCCAA GTGTTCTCAT TGTTCAGTTC CCACCTGTGA 
CTTGCAATAG TTTGCTCAGA GTGATGGTTT CCAGCTTCGT 
CTTTTTTATG ACTGCATAGT ATTCCGTGGT GTATATGTGC 
GGACATTTGG GTTGGTTGCA AGTCTTTGCT ACTGTGAATA 
CTTTATAGCA GCATGATTTA TAATCCTTTG GGTATATACC 
TTCTAGTTCT AGATCCTTGA GGAATCACCA CACTGTCTTC 
CAACAGTGTA AAAGTGTTCT GGTGCTGGAG AGGATGTGGA 
ACTGAACAAG CAGACAGTTA GTGAAGGATG CGTCAGGAAG 
GACTCCGGGT TTTTCCTGTG CATCTTTTGA AACTCTAGCT 
TCTTCTTCAT TAAGGTTCAA GTTCTAGATT GAAATAAGTT 
CACAACTTGC TCTGGGATTT GGAGGAAAGT GTCCTCGAGC 
GGATACCTCT GGCCCATGGT CATGGGGCGC TGGGCTTGGG 
CTTCCTGTGG ATAGGATCTG GGTCTCGGAT CATGCTGAGG 
ACGTGGCTCA GAGGGGGCGA GGTTCCCAGC CCCAGCTTTC 
TCTGAGAAGT GGGGCCGCGC CTGATGGCCT TCGTTCGTCT 
GTAAACACTG AGTACTTATA ATGAATGAGG AATTGCTGTA 
AAAGAAATTT AAGTTTTTCA TTTAACCGCT TTGGAGAATG 
GACATTCAGT CCCTCGTAGA CAGATACTAC GTAAAAAGTG 
ATTTTAGGCT GCTCCTGCGT TTGGTGGATG ATTTCTTGTT 
CTTCCTCAGG TGAGGCCCGT GCCGTGTGTC TGTGGGGACC 
CCCCGTGTCC TGCCCCTGGC ACCGCAGCGT TGTCTCTGCC 
GCAAGAGCAG AGGCGCTTGG CCGTGCACCC AGGCCTGGGG 
ACCGTGCAGG CCCTGGTCCT GCAGAGACGC ACCCAGGTTA 
CTCCTGCTGC TCTTTGGAAA GTCAAGAGTG GCGGCTCCTG 
ACAGGGCCTG CAGGGCCGAG GCGGCAGCCT CCTCCCCAGG 
GCTGAGTGAG CTGGCCCACA GCGTTCGCTG CGGTCACGTT 
GAATTTGGAT TTGCTGAGTG CTGCTGTCTT GAACCACGGA 
TTTGTGAATC AAACTAAAAT CAGGCACAGG GGACCTGGCC 
CCTCAAGGGC GCCCCACAGA GCCGGTGGGC TTGTTTTAAA 
AAAGCTGTAA AGGGAACCCT CAGAAAATGT GGCCGCCAGG 
TTGTGAAAAC CCATTTGGAC CCGCCCTCCA AGTCCACCCT 



CCCTCCGGCT CCTGGGCTGC AGGCTCCCGA 5110 
AGCAGGTGCC ACACGAGCCC TGGAAATGGC 5180 
CGGGGGGTGT GTCTGGGTCA GGTGTGCGCC 5250 
TGACGCTGGA CACCCGGCTC TCACACGCTT 5320 
TCATTCCTGT CCCTGTCGTG TGACCCCCGC 5390 
TGGAAAGTGC GGGGTTGACC GTGTAGTTTG 54 60 
CTGGGAGAGC TGCCGTCACA CAGCCACTGG 5530 
CCACATCACG TCCTCTGGAT TTTAAGTAAA 5600 
TGTGCCTGGG GAGAGTGGTA GCACGGAGGA 5670 
GTCAGGTGGA ACGTGGAGGC CTCTCTCTGG 57 40 
AGCTTTTATT TAAAAATATA ACTATTAATT 5810 
ATATTTATTA AAGTATAATT AGAAATATTA 5880 
CAGCAGAGTG AATTTTGGCC GAGGGACACG 5950 
CGCTGACAAA GTCACCTCCC CAGAGAAGCC 6020 
GATCAAGTCA CGTACCGTCC ACGTGTGGCA 6090 
CCTGACAGAC AGGAGGTGAC TGTGTCTGTC 6160 
ATCGTGGTCC AGTTTGGCCT CTGAATAAAA 6230 
AGAGTTTCCC ATCCCATGTG CTCACAGGGG 6300 
TAGAGTTGGT GCGTGTCCTT CTGTGCAAAA 6370 
CAAGGAAAGC CTCTTTTCTT TTCTTTCTTT 64 40 
CTTGAGTGCA GTGGCGCGAT CTCAACTCAC 6510 
CAGCCTCCCG AGCAGCTGAG ATTACAGGCA 6580 
AGAGGGGTTT TTGCCATGTT GGCCAGGCTG 6650 
CTCCCAAAGT GCTGGGATTA CAGGTGTGAG 6720 
CCTATAGCGC TTCCCGAAAA TAACAGGTCT 67 90 
GTGGCGTCCT GTGGGCTCTG GGGATGGCTG 68 £0 
GTTCCACGGG GCTATTCTGC TCTCACTGTT 6930 
TCTGCTTCTC GTTGGTCATG CTGAAACTAG 7 000 
GGGTCATGAG TCTTTCACCG TGGACAAATT 7070 
CGGGTCAAGT GTCTGGTTCT GTGAATAAAC 7140 
ATTCAGAGCA AGGATGTGGT CACACCTGTG 7210 
GGGAGCAGGG ATTGTTTGTT CAGAGGTCTC 7280 
ACGTGTCGTT TGTGTGTATG AGGTTCTGTG 7 350 
ATGCCCTGCC CGTCTCTCAC CTGTGTCTTC 7 420 
GGCTCCATCC TCTCCACGCT GCTCTGCAGC 74 90 
TTCGGCGGGA CGGGTGAGGC CTCCTCTTCC 7560 
TTCAGTGTTA ATATTCCTGG TGCTCTGGAG 7630 
GCCCCTTCTT GGTATGAAGC CGCACGGGAG 7 700 
TGTCCAGCGG CCATGTCCAG AGGCCTCAGG 7770 
TGTGAATTCA ACACCGAGGA AGCACACCAG 7840 
AGATGGGGCT GGTGCAGCCT GAGGCCCCAC 7 910 
CCTCTTCAGC CCATTGCCCA TCCCACTTGC 7 980 
GCCAACCTAA TGTGGTTCAA CTCAGCTGGC 8050 
AGTTCTAGGG TACATGTGCA CGACGTGCAG 8120 
CACCCATTAA CTCATCATTT ACATTAGGTA 8190 
GACAGGCCCT GGTGTGTGAT GTTCCCCACC 8260 
GTGAGAACAT GTGGTGTTTG GTTTTCTTTC 8330 
CCATGTCCCT ACAAAGGACA TGAACTCATC 8400 
CACATTTTCT TAATCCAGTC TATCATCGAT 8470 
GTGCCGCAAT AAACATACGT GTGCATGTGT 8540 
CAGTAATGGG ATGGCTGGGT CAAATGGTAT 8610 
CACAATGGTT GAACTAGTTT ACACTCCCAC 8680 
CAGCAGTTAT TTTTTTATGA AAATAGTATC 8750 
CCTGCAGGCC ACACAGCCAT TTCTCTCGAA 8820 
CCAATTATAG CATGTACAGT GGATCAAGGT 8890 
TATGTAACAG AAACAAAAAT TTCTTGTACA 8960 
TGGCGGCACA CTGGTCAGCC CTCTGGGACA 9030 
CCTGAGGGTC ACACAGTGCA CCATGCCCAG 9100 
ACCACAGCTG CCATGCTGGT AAAGGGCACC 9170 
TTACCGTCTT CAGTTATTTT TCCCTAAGAG 9240 
TCAGCTGGCA CAGAATTGCA CAAGCTGATG 9310 
GCAGTTAACT GTAGAGAGCT CGTCTGTTGG 9380 
TTACTTTATT TATGGCTGTG TAAATTGTTT 94 50 
TAAAGTTAAC CTTGCTGTGT ATTTTCCCTT 9520 
GGTGACACCT CACCTCACCC ACGCGAAAAC 9590 
TCCACAGCCT GTGGGCTTTG CAGTTGAGCC 9660 
AAGTCCTCTC TCTCTGCCGG TGCTGGATCC 97 30 
GCGCAGGGGC ACCTTCGGGA GGGAGTGGGT 9800 
CACACGTGGT GAGTGCAGGC GGTGACCTGG 9870 
GGGCCCCAGT CAGACCCCCA GGAGCTGTGC 9940 
GTGCACCTGA GCCTGCGGAG AGCAGGAGCT 10010 
CCTGCGTGGG GTTGTTTGGG ATCGGTGGGA 10080 
GATGGCTAGG AGTGGGTTTC AGAGTTGATT 10 ISO 
TCAGCACAGG GGATTGTCCA ATGTGGTCCC 10220 
GTGCGATTTG ACGAGGGACG AGAAACCTTG 10290 
GGTGGTTTCA GGTGCTTTGC TGGGCTGTGT 10360 
CCAGGTCCAC CCTCCAGGGC CGCCCTGGGC 104 30 
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TGGGGGTATG CCTGGCGTTC CTTGTGCCGC AGCCCGGAGC 
AGATTCACTC GGGGGGAGCC CAGGTCCCAA GCAACTGAGG 
AGAGCAGACG GGGAACGCTG CTTCTGTGTG GCAAGTTCCT 
TGTATGTTGG GGTCCCACCG GGGGCAGAAC TCTGTCTCTG 
TCGCCACAGG GAGCTGGGAA TGCACCAGGG GAGCTGCGCA 
GAAGGGCAGG GGGACGCCCG GGGCCACAGC AGAGGCCGCA 
GAGGCTACCG GGCACAGGGG GGCTCCCTGA GCTGGGTGAG 
TTGACGTGAA GCTGACGACT GGTGTTGCCC AGCTCACAGC 
CAGAACCCTC CCCTTTGTCT AAAGCACAGC AGATGCCTTC 
TTGAGAAACG TCTTAAAAGA AGGTGGGATG GTGGCAATTT 
CAGATGAGTC TATAACGGCA TTGTGGTGTT GCCATGGGGA 
GGGGCTGCAC CTCCCATCTG AGTCCTGCCT GTCCCGGGTC 
GTCCTGCCCG GGAGACAGGG AAAGCACCCC GAAGTCTGGA 
CTGCCAGGCC CAGCACCCTG CTCCAAATCA CCACTTCTCT 
CAGGTTACCT CCTGGGTGAC GGCCCCGCAT CCTGGGGCTG 
CGAGGTGTCC CTGAGTATGG CTGCGTGGTG AACTTGCGGA 
AGGCCCTGGG TGGCACGGCT TTTGTTCAGA TGCCGGCCCA 
GGATACCCGG ACCCTGGAGG TGCAGAGCGA CTACTCCAGG 
GCCCGGCTGG GGCAGGTGCT GCTGCAGGGC CGTTGCGTCC 
CCAATCCCAA AGGGTCAGAG GCCACAGGGT GCCCCTCGTC 
CTGTGGGAGT GAGGGTGCTC ACAACGGGAG CAGTTTTCTG 
AGACCTGGGT GCACTGAGGT GTCTTCAGAA AGCAGTCTGG 
GGCGTGAGTC TCTCAAACCC GAACACAGGG GCCCTGCTGG 
GGCCCTGCTG GGCGTGAGTC TCTCCGAACC CAGAGACTTC 
GTGAGCCCCA CACTCCAAGG CTCATCCACA GTCTACAGGA 
TCAGGGGACA GGGCCATGGT GTGGGGGGGG TCTCTACAAA 
GAGCTCAAGG CCCCGTCTCA GGCTCAGACA CAAATGAATT 
TGTTTCTTTT ATGAATAAAA AGTATCAACA TTCCAGGCAG 
ACTTTGGGAG GCCGAGGTGG GTGGATCACT TGAGGCCAGG 
AATTCCATTT CTACTTAAAA AATACAAAAA TTAGCCTGGC 
GCGGGAGGCT GAGGCAGGAG AATCATTTGA ACCCAGGAGG 
CTGCACTCCA GCCTGGGCAA CAGAGTGAGA CTTCATCTTA 
AACCATAGTG GACAGGTGTT TTTTTATTCT GTCCTTCGAT 
AACTGGGGGT GCCTTCCTCT GAAAGGCACA CCTTCATGGG 
CCAGAGGTTT AAACTGGGGT CCTGTCGTTC TGAGTTAACA 
ATGCTCCCTG GGGTTTGCTT CATGGGGGAG CAGCAGGTGT 
GCAGACGCCC TCATGATGGG GGAGTGGCAG GTGCAGACAC 
TGCAGCTCCC TCCCCACAAG GATGCCGGTC TCCTGTGCTC 
TACCTGGTCC TGGCCTCCAC TGGCTTTGTC TGCATGATTT 
GCCTCTCCCA GGCACCTCTG CAGTGCTGGC CATACCAGTC 
CCCCATGAAA TGTATTTTTT AGGACAGGCA CCCCTGGTTC 
TTGAAGGACA AAGGACAGAC AAACAAATCA GGAAAATGGG 
GGCTAGTGCA GGATGGGTGG GCATCAGGTC ATCAGATGTG 
AAGGCCACTT GGTCAGAGTG TGTGCTTGCA GAGGTGGCTC 
CCATACTCAG GGTGAACTCA CATCCTCTGT GTCTGAAGTA 
AAGAAAACAG GCAAAATGAT TAAGAAAAGT GAAAAAGGAA 
ATTTTAGTCT CCCAAACCAC AGCTCAGATG GTAGAATGTG 
AAACGGAAGC CCTATCTCTC AGAAACGTGT GTTAATGTGG 
TGTGTGTAAT TTTTTTTTCT GAGAAAACTG ACTGGAAGCA 
AGCAGATTCT AGGTAGAAGA GGAGACACAT GCAAACAACA 
AGGGAAGGGA GGTGAACGTT CCCTGGTTTG GTGTTGGGGA 
GAGGCAACGG GCATTGCTTT CACTGCAGAG AAACTCAGCT 
CTGGAGCGTT TGTGCACGTG ATTTATTTAA GGCGCCCTGT 
TTCTCCTAAC CACCTGAGAG GTAGAGGAGG AAAGGCTCCA 
GCAAAGGGCA TGCATGATTG CAGCCTGGCC TCCTGCTCCG 
AAGTCAGACC CATAGGCTCA GGGTGAGCCG GAGCCCAAGG 
TGGACGTCTG ATGCACACTT GGGAAGGTCC TACCAGCAGC 
AGACCCATCC CTCAAAGAAA CGCACGTGAA ACTGATGGCG 
TTTTCTGGGC TTGCCAAGAG CCAGCATCAG GTTGAGGCAA 
TTTGCATGGA AGTCCTCACA ATGTCCTGTG TCTTCCCAGT 
CACGGGTCTT ATTTACCATT TCCAGTGTTC CAGGCAGGGG 
AAATACAGGG CTAAGGAGAT ATTATGCATC ACAAAACTTG 
TTGAAGAATG TTTAATGGCA CAAAACGTTT ATTTCAATGT 
ACACCCCAGG AGCCTGCCGT GAATGTCATG TGTGTTCATC 
GGTGGTGAGG CCCTGGAGGA CATCGGTGGG ATGCCTCCAT 
CGTGCACTCA CTGGAGCCCT GTTTAGCTGG TGCCACCTGG 
AGATTCCCCA CGCCCAACTC AGTGTTCTCC CACAAAAAAC 
GCCCGGGAGC CAGGGCTCCA CAGTTTATTA TGTGTTTTTG 
GATGATGAGT GCACAAACAC GGCCGTGCGA GGTTTGGATA 
AGTTTGGTCA TGCAGAGTCT GGATGGCATG TAGCATTTGG 
GGCTGCAGCG CATGCCCCAG GCAGGACAAG GAAGCGGGAG 
GCAGGAGGGG GCTGGGTGTG GGGCAGGCAC CTGTGTCTGA 
ACCTCCATCA GAGCCAGTCT CACCTTCAAC CGCGGCTTCA 
TTGGGGTCTT GCGGCTGAAG TGTCACAGCC TGTTTCTGGA 
AGAGTTCAGA GTTCAGGAGG TGTGTCCGCA AGTATGTGTG 
ATGGTGACTG GCTGCACGTA AGAGTGCACA TGTACGCATA 
TGTACATGAA GGCATGGCAG TGTGTGCACA GGTGTGCAAG 



ACAGCAGGCT GTGCACATTT AAATCCACTA 10500 

GCTCAGGAGT CCTGAGGCTG CTGAGGGGAC 10570 

GAGGGTGCTG GCCAGGGAGG TGGCTCAGAG 10640 

ATGAGTCGGC AGCCATGTAA CAGGAAGGGG 10710 

GCTGGCCGAG GTCCCAGGGC CAGGCCACAG 107 80 

GGAAGGGAAG GGGATGCCCA GGCCAGAGCA 10850 

CGAGGCTCAT GACTCGGCGA GGGAACCTCC 10920 

CCAGCCAGGT CCCGCGCCTG AGCAGGAACT 10990 

AGGGCATCTA GGAGAAAACA GGCAAAGTCG 11060 

CTTGTCCAGA TTTTAGTCTG CCCCGGACCA 11130 

CACATGAGAT GGACCATCAC AGAGGCCACT 11200 

CAGGCCAGGT TCTTGCATGC TCACCTACCT 11270 

GCAGGGCTGG GTCCAGGCTC CTCAGAGCTC 11340 

GGGGTTTTCC AAAGCATTTA ACAAGGGTGT 11410 

ACATTGCCCC TCTGCCTTAG GACCCTGGTC 11480 

AGACAGTGGT GAACTTCCCT GTAGAAGACG 11550 

CGGCCTATTC CCCTGGTGCG GCCTGCTGCT 11620 

TGAGCGCACC TGGCCGGAAG TGGAGCCTGT 11690 

ACCTCTGCTT CCGTGTGGGG CAGGCGACTG 11760 

CCATCTGGGG CTGAGCAGAA ATGCATCTTT 11830 

TGCTATTTTG GTAAAAGGAA ATGGTGCACC 11900 

ATCCGAACCC AAGACGCCCG GGCCCTGCTG 11970 

GCATGAGTCC CTCTGAACCC GAGACCCTGG 1204 0 

AGGGCCCTTT TGGGCGTGAG TCTCTCCGCT 12110 

TGCCATGAGT TCATGATCAC GTGTGACCCA 12180 

ATTCTGGGGT CTTGTTTCCC CAGAGCCCGA 12250 

GAAGATGGAC ACAGATGCAG AAATCTGTGC 12 320 

GGCAAGGTGG CTCACACCTA TAATCCCAGC 12390 

AGTTTGAGGC CAACCTAACC AACATAGTGA 124 60 

CTGGTGGCAC ACGCCTGTAG TCCCCGCTAT 12530 

CAGAGGTTGC AGTGAGCCGA GATCACACCA 12 600 

AAAAAAAAAA AAAAAGTATC AGCATTCCAA 12 670 

AATATTTACT GGTGCTGTGC TAGAGGCCGG 12 740 

AAGAGAAATA AGTGGTGAAT GGTTGTTAAA 12810 

GTCCAGATCT GGACTTTGCC TCTTTCCAGA 12880 

GGACACCCTC GTGATGGGGG AGCAGCAGGT 12950 

CCTTGTGCAT GGTGCCCAGC ATGTCCCTGT 13020 

CCCACAGTCC CTGCTTCCCT CTCACAGCCT 13090 

CCACATTTCC TGGGCTCCCA GCACCTCTTC 13160 

AGCTGTGAAC TGTCCACTGC TTATTTTGCT 13230 

CAGCCTCTGG CACAGCATCA GTGAATGTTA 13 300 

TTCTCTCTAA ACACATTGCA AAGCCACAGA 13370 

GGTCCAATGC CAGAATATTC TGTGCTCCCA 134 40 

TAAAAGCTCA GCAGTGGAGG CAGTGGTTCG 13510 

TACAGCAGAG GCTTGAAGGG CATCTGGGAG 13580 

AAGTGGTAAG ATGGGAATTT TCTTGTCCAG 13550 

GTCAGAACTG ATGGACAGAA CAATAGAACA 13720 

TATGTGGCAC AGCTGATGGA AAAGAGAGTG 13790 

AATAAGTTGT GTCTTTACAG CA7ATACCAG 13860 

CCAGCAACAG AAATAAAACA AAAGACTCAA 13930 

AGGACACACA GGGAGGCGGA TGAAACCAGT 14000 

TGCCTGAGCC ACAGTGAAAA TGGCCATTCC 14070 

GAGGTCCTGC ACATTCATCC TCTCACTTTG 14140 

GGGGAGCAGC CGCCCTTGGT CACCCAGCTG 14210 

GGGCCCTTGC TCTGCCCGAG GACCCCACAC 14280 

TCGTGTTGGG GATGGCTGTG AAAGAAGAAA U350 

GTCAAAGAAA TGCATGTGAA ACTGACAGCG 14 420 

AGACCTGTCC CCATCCCTCA TGCTGGCTCC 14490 

GCTGGAAAGA CTTTTCTGGA AAGCAGCTTG 14 560 

AATTCCACTT CTGAAGTGAC C AG AC ATT AT 14 630 

GACTTGCCAC AGCAAGTCAC GAACCTGCCC 14700 

CTCTGCCATT AAACATTTTT CAAAGAATTT 14 770 

AGCACTGTTC AAAGCTGGAT GTAAAAGAAC 14 840 

TTTGGACATG GACATACATG GGCAGTGAGT 14910 

CCTGCCCCTC TGGAGACACC ATGTGTGCCA 14980 

CTCTTCCATC CCTGAGATTC AAACACAGTG 15050 

CTGAGTCACA CCTGTGTTCA CTCGAGGGAC 15120 

GCTGAGTTAT GTGCAGATCT CATCAGGGCA 15190 

CACTCAACAT CACTAGCCAG GTCCTGGTGG 152 60 

AGTCCATGGA GTGAGCACCC AGCCCCCTCG 15330 

GAAGGCAGGA GGCTCTTTGG AGCAAGCTTT 15400 

CATTCCCCCC TGTGTCTCAG CTATGCCCGG 15470 

AGGCTGGGAG GAACATGCGT CGCAAACTCT 15540 

TTTGCAGGTG AGCAGGCTGA TGGTCAGCAC 15610 

TGTGTGTGTG CGCGCGTGCC TGCAAGGCTG 15680 

TACACGTGAG CACATACATG TGTGCATGTG 15750 
GGCACAAGTG TGTGCACATG CGAATGCACA 15820 



WO 99/33998 



PCT/EP98/08216 



34 



CCTGACATGC ATGTGTGTTC GTGCACAGTC GTGTGGGCAT TCACGTGAGG TGCATGCGTG TGGGTGTGCA 15890 
GTGTGAGTAG CATGTGTGCA CATAACATGT ATTGAGGGGT CCTCGTGTTC ACCCCGCTAG GTCCTCAGCA 15960 
CCAGTGCCAC TCCTTACAGG ATGAGACGGG GTCCCAGGCC TTGGTGGGCT GAGGCTCTGA AGCTGCAGCC 16030 
CTGAGGGCAT TGTCCCATCT GGGCATCCGC GTCCACTCCC TCTCCTGTGG GCTTCTGTGT CCACTCCCCC 16100 
TCTCCTGTGG GCATTTACAT CCACTCCACT CCCTCTCTCC TGTGGGCATC CGCGTCCACT CCCCCTCTCT 16170 
GTGGGCATCT GCGTCCACCT CCCCTCTCTG TGGGCATTTG CGTCCACTCC CTCTCCTGGT TCCTTCCTGT 1624 0 
CTTGGCCGAG CCTCGGGGGC AGGCAGATGA CACAGAGTCT TGACTCGCCC AGGGTGGTTC GCAGCTGCCG 16310 
GGTGAGGGCC AGGCCGGATT TCACTGGGAA GAGGGATAGT TTCTTGTCAA AATGTTCCTC TTTCTTGTTC 16380 
CATCTGAATG GATGATAAAG CAAAAAGTAA AAACTTAAAA TCCCAGAGAG GTTTCTACCG TTTCTCACTC 164 50 
TTTCTTGGCG ACTCTAGGTG AACAGCCTCC AGACGGTGTG CACCAACATC TACAAGATCC TCCTGCTGCA 16520 
GGCGTACAGG TGAGCCGCCA CCAAGGGGTG CAGGCCCAGC CTCCAGGGAC CCTCCGCGCT CTGCTCACCT 16590 
CTGACCCGGG GCTTCACCTT GGAACTCCTG GGTTTTAGGG GCAAGGAATG TCTTACGTTT TCAGTGGTGC 16660 
TGCTGCCTGT CCACAGTTCT GTTCGCGTGG CTCTGTGCAA AGCACCTGTT CTCCATCTCT GGGTAGTGGT 16*7 30 
AGGAGCCGGT GTGGCCCCAG GTGTCCCCAC TGTGCCTGTG CACTGGCCGT GGGACGTCAT GGAGGCCATC 16800 
CCAGGGCAGC AGGGGCATGG GGTAAAGAGA TGTTTATGGG GAGTCTTAGC AGAGGAGGCT GGGAAGGTGT 16870 
CTGAACAGTA GATGGGAGAT CAGATGCCCG GAGGATTTGG GGTCTCAGCA AAGAGGGCCG AGGTGGGTGC 16940 
AGGTGAGGGT CGCTGGCCCC ACCCCCGGGA AGGTGCAGCA GAGCTGTGGC TCCCCACACA GCCCGGCCAG 17 010 
CACCTGTGCT CTGGGCATGG CTGTGCTCCT GGAACGTTCC CTGTCCTGGC TGGTCAGGGG GTGCCCCTGC 17080 
CAAGAATCGA CAACTTTATC ACAGAGGGAA GGGCCAATCT GTGGAGGCCA CAGGGCCAGC TTCTGCCTGG 17150 
AGTCAGGGCA GGTGGTGGCA CAAGCCTCGG GGCTGTACCA AAGGGCAGTC GGGCACCACA GGCCCGGGCC 17220 
TCCACCTCAA CAGGCCTCCC GAGCCACTGG GAGCTGAATG CCAGGAGGCC GAAGCCCTCG CCCCATGAGG 17290 
GCTGAGAAGG AGTGTGAGCA TTTGTGTTAC CCAGGGCCGA GGCTGCGCGA ATTACCGTGC ACACTTGATG 17360 
TGAAATGAGG TCGTCGTCTA TCGTGGAAAC CCAGCAAGGG CTCACGGGAG AGTTTTCCAT TACAAGGTCG 174 30 
TACCATGAAA ATGGTTTTTA ACCCGAGTGC TTGCGCCTTC ATGCTCTGGC AGGGAGGGCA GAGCCACAGC 17500 
TGCATGTTAC CGCCTTTGCA CCAGCTCCAG AGGCTTGGGA CCAGGCTGTC TCAGTTCCAG GGTGCGTCCG 17 570 
GCTCAGACCG CCCTCCTCTC TGCCTTCTCT CTCTGCCTCA AATCTTCCCT CGTTTGCATC TCCCTGACGC 17 640 
GTGCCTGGGC CCTCGTGCAA GCTGCTTGAC TCCTTTCCGG AAACCCTTGG GGTCTGCTGG ATACAGGTGC 17710 
CACTGAGGAC TGGAGGTGTC TGACACTGTG GTTGACCCCA GGGTCCAGCT GGCGTGCTTG GGGCCTCCTT 17780 
GGGCCATGAT GAGGTCAGAG GAGTTTTCCC AGGTGAAAAC TCCTGGGAAA CTCCCAGGGC CATGTGACCT 17850 
GCCACCTGCT CCTCCCATAT TCAGCTCAGT CTTGTCCTCA TTTCCCCACC AGGGTCTCTA GCTCCGAGGA 17 920 
GCTCCCGTAG AGGGCCTGGG CTCAGGGCAG GGCGGCTGAG TTTCCCCACC CATGTGGGGA CCCTTGGGTA 17 990 
GTCGCTTGAT TGGGTAGCCC TGAGGAGGCC GAGATGCGAT GGGCCACGGG CCGTTTCCAA ACACAGAGTC 18060 
AGGCACGTGG AAGGCCCAGG AATCCCCTTC CCTCGAGGCA GGAGTGGGAG AACGGAGAGC TGGGCCCCGA 18130 
TTTCACGGCA GCCAGGCTGC AGTGGGCGAG GCTGTGGTGG TCCACGTGGC GCTGGGGGCG GGGTCTGATT 18200 
CAAATCCGCT GGGGCTCGGC CTTCCTGGCC CGTGCTGGCC GCGCCTCCAC ACGGGCTTGG GGTGGACGCC 18270 
CCGACCTCTA GCAGGTGGCT ATTTCTCCCT TTGGAAGAGA GCCCCTCACC CATGCTAGGT GTTTCCCTCC 18340 
TGGGTCAGGA GCGTGGCCGT GTGGCAACCC CGGGACCTTA GGCTTATTTA TTTGTTTAAA AACATTCTGG 18410 
GCCTGGCTTC CGTTGTTGCT AAATGGGGAA AAGACATCCC ACCTCAGCAG AGTTACTGAG AGGCTGAAAC 18480 
CGGGGTGCTG GCTTGACTGG TGTGATCTCA GGTCATTCCA GAAGTGGCTC AGGAAGTCAG TGAGACCAGG 18550 
TACATGGGGG GCTCAGGCAG TGGGTGAGAT GAGGTACACG GGGGGCTCAG GCAGTGGGTG AGGCCAGGTA 18620 
CATGGGGGGC TCAGGCACTG GGTGAGATGA GGTACACGGG GGGCTCAGGC AGAGGGTCAG ACCAGGTACA 18690 
CGGGGGCTCT GATCACACGC ACATATGAGC ACATGTGCAC ATGTGCTGTT TCATGGTAGC CAGGTCTGTG 187 60 
CACACCTGCC CCAAAGTCCC AGGAAGCTGA GAGGCCAAAG ATGGAGGCTG ACAGGGCTGG CGCGGTGGCT 188 30 
CACACCTGTA GTCCCAGCAC TTTGGGAGGC CGAGGCGAGA GGATCCCTTG AGCCCAGGAG TTTAAGACCA 18900 
GCCTGAGCAA CATAGTAGAA CCCCATCTCT ATGAAAAATA AAAACAAAAA TTAGCTGAAC ATGGTGGTGT 18970 
GCGCCTGTAG TTCCAATACT TGGGAGGCTG AAGTGGGAGG ATCACTTGAG CCCAGGAGGT GGAAGCTGCA 19040 
GTGAGCTGAG ATTGCACCAC TGTACTGCAG CCTGGGTGAC AGAGTGAGAG CCCATCTCAA CAACAACAAA 19110 
GAAGACTGAC AAATGCAGTT TCTTGGAAAG AAACATTTAG TAGGAACTTA ACCTACACAC AGAAGCCAAG 19180 
TCGGTGTCTC GGTGTCAGTG AGATGAGATG ATGGGTCCTC ACACCATCAC CCCAGACCCA GGGTTTATGC 19250 
ACCACAGGGG CGGGTGGCTC AGAAGGGATG CGCAGGACGT TGATATACGA TGACATCAAG GTTGTCTGAC 19320 
GAAGGGCAGG ATTCATGATA AGTACCTGCT GGTACACAAG GAACAATGGA TAAACTGGAA ACCTTAGAGG 19390 
CCTTCCCGGA ACAGGGGCTA ATCAGAAGCC AGCATGGGGG GCTGGCATCC AGGATGGAGC TGCTTCAGCC 194 60 
TCCACATGCG TGTTCATACA GATGGTGCAC AGAAACGCAG TGTACCTGTG CACACACAGA CACGCAGCTA 19530 
CTCGCACACA CAAGCACACA CACAGACATG CATGCATGCA TCCGTGTGTG TGCACCTGTG CCCATGAGGA 19600 
AACCCATGCA TGTGCATTCA TGCACGCACA CAGGCACCGG TGGGCCCATG CCCACACCCA CGAGCACCGT 19670 
CTGATTAGGA GGCCTTTCCT CTGACGCTGT CCGCCATCCT CTCAGGTTTC ACGCATGTGT GCTGCAGCTC 19740 
CCATTTCATC AGCAAGTTTG GAAGAACCCC ACATTTTTCC TGCGCGTCAT CTCTGACACG GCCTCCCTCT 19810 
GCTACTCCAT CCTGAAAGCC AAGAACGCAG GTATGTGCAG GTGCCTGGCC TCAGTGGCAG CAGTGCCTGC 19880 
CTGCTGGTGT TAGTGTGTCA GGAGACTGAG TGAATCTGGG CTTAGGAAGT TCTTACCCCT TTTCGCATCA 19950 
GGAAGTGGTT TAACCCAACC ACTGTCAGGC TCGTCTGCCC GCCCTCTCGT GGGGTGAGCA GAGCACCTGA 20020 
TGGAAGGGAC AGGAGCTGTC TGGGAGCTGC CATCCTTCCC ACCTTGCTCT GCCTGGGGAA GCGCTGGGGG 20090 
GCCTGGTCTC TCCTGTTTGC CCCATGGTGG GATTTGGGGG GCCTGGCCTC TCCTGTTTGC CCTGTGGTGG 20160 
GATTGGGCTG TCTCCCGTCC ATGGCACTTA GGGCCCTTGT GCAAACCCAG GCCAAGGGCT TAGGAGGAGG 20230 
CCAGGCCCAG GCTACCCCAC CCCTCTCAGG AGCAGAGGCC GCGTATCACC ACGACAGAGC CCCGCGCCGT 20300 
CCTCTGCTTC CCAGTCACCG TCCTCTGCCC CTGGACACTT TGTCCAGCAT CAGGGAGGTT TCTGATCCGT 20370 
CTGAAATTCA AGCCATGTCG AACCTGCGGT CCTGAGCTTA ACAGCTTCTA CTTTCTGTTC TTTCTGTGTT 204 40 
GTGGAAATTT CACCTGGAGA AGCCGAAGAA AACATTTCTG TCGTGACTCC TGCGGTGCTT GGGTCGGGAC 20510 
AGCCAGAGAT GGAGCCACCC CGCAGACCGT CGGGTGTGGG CAGCTTTCCG GTGTCTCCTG GGAGGGGAGC 20580 
TGGGCTGGGC CTGTGACTCC TCAGCCTCTG TTTTCCCCCA GGGATGTCGC TGGGGGCCAA GGGCGCCGCC 20650 
GGCCCTCTGC CCTCCGAGGC CGTGCAGTGG CTGTGCCACC AAGCATTCCT GCTCAAGCTG ACTCGACACC 20720 
GTGTCACCTA CGTGCCACTC CTGGGGTCAC TCAGGACAGG CAAGTGTGGG TGGAGGCCAG TGCGGGCCCC 207 90 
ACCTGCCCAG GGGTCATCCT TGAACGCCCT GTGTGGGGCG AGCAGCCTCA GATGCTGCTG AAGTGCAGAC 20860 
GCCCCCGGGC CTGACCCTGG GGGCCTGGAG CCACGCTGGC AGCCCTATGT GATTAAACGC TGGTGTCCCC 20930 
AGGCCACGGA GCCTGGCAGG GTCCCCAACT TCTTGAACCC CTGCTTCCCA TCTCAGGGGC GATGGCTCCC 21000 
CACGCTTGGG AGCCTTCTGA CCCCTGACCT GTGTCCTCTC ACAGCCTCTT CCCTGGCTGC TGCCCTGAGC 21070 
TCCTGGGGTC CTGAGCAAGT TCTCTCCCCG CCCCGCCGCT CCAGCGTCAC TGGGCTGCCT GTCTGCTCGC 21140 
CCCGGTGGAG GGGTGTCTGT CCCTTCACTG AGGTTCCCAC CAGCCAGGGC CACGAGGTGC AGGCCCTGCC 21210 
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TGCCCGGCCA CCCACACGTC CTAGGAGGGT TGGAGGATGC 
ATTTTGGCCC CGCAGCCCAG ACGCAGCTGA GTCGGAAGCT 
CGCAGCCAAC CCGGCACTGC CCTCAGACTT CAAGACCATC 
GCCGAGAGCA GACACCAGCA GCCCTGTCAC GCCGGGCTCT 
CCAGGCCCGC ACCGCTGGGA GTCTGAGGCC TGAGTGAGTG 
GCTGAGTGTC CGGCTGAGGC CTGAGCGAGT GTCCAGCCAA 
CACTTCCCCA CAGGCTGGCG CTCGGCTCCA CCCCAGGGCC 
CTCCCCACAT AGGAATAGTC CATCCCCAGA TTCGCCATTG 
CCACCCCCAC CATCCAGGTG GAGACCCTGA GAAGGACCCT 
GTGTGCCCTG TACACAGGCG AGGACCCTGC ACCTGGATGG 
GCTGTGGGAG TAAAATACTG AATATATGAG TTTTTCAGTT 
GTGCACTGCA TAGACACCAC TGTATGCAAT TACAGAAGCC 
GCCCATGGCC TGGCTGTGCA TTTACGGAAG TCTATGAGTG 
CCTGGCTGGG CCTGGGAGGT TTCTGATGCT GTGAGGCAGG 
GAGCCCCCAC CCTGGAAGAC ATAACAGTAA GTCCAGGCCC 
TTGGGCGGCG GGGATGATGG AGGGCCTGGC CAGGGTGGCA 
GGGGTGATGG GGGGGGCTGG TCTGGGTGGC GGGGAAGATG 
GCCTCCCACC TGCAGCCGTG GATCCGGATG TGCTTCCCTG 
GGAGGTGGGG GGCAGGGGCA TGACACCATC CTGTATAAAA 
TCAGGTTGAA AGTCACATTC CGCCTCTGGC CATTCTCTTA 
GTGGGTAGGG TGGGGCAGTG GAGGGTGTGG ACACAGGAGG 
TCCTCTTATC ATCTCCCAGT CTCATCTCTC ATCCTCTTAT 
TCTCCCAGTC TCATCTGTCA TCCTCTTACC ATCTCCCAGT 
CATCCAGACT TACCTCCCAG GGCGGGTGCC AGGCTCGCAG 
GAAGGAACTG GAAGGATTGC AGAGAACAGG AGGGGCGGCT 
AGCCCCTCCT CAGAAGTTGG CTTGGGCCAC ACGAAACCGA 
CAGCAGGTCC CTGGTGGGGC CTTATGGTAT GGCCGGGTCC 
TTTGAGTGCA GCCCGGACGT GCCTGGTGTC GGGGTGGGGG 
TGCTGCTGCT TCAGAGAATG TCTGAGTGAC CGAGCCTAAT 
GTCGTAAATG CACTCTGGTG CCTGGAGCCC CCGTATAGGA 
GGCCTGGGGG CGCCTTTGCC CTGCAAACTG GAAGGGAGCG 
GTGAGAGGTT GGACAGAACA GGGCGGGGAC TTCCCAGGAG 
TGAATCACAG ACCAACaGGT CAGGCCATTG TTCAGCTATC 
CTCCGGGTGT TTTTTGTTGA AATTTTACTC AGGATTACTT 
AAAAGGTATT TGCTTTGATA TGGCTTAACT CACTAAGCAC 
T ATT ATT ATT ATTAGAGATG GTGTCTACTC TGTCACCCAG 
GCTGTAGCCG CAAACCCCCA GGCTCAAGTG ATCCTCCGGC 
TGTGAGCCAC TGCCCTTGCC TGGCACTTTT AAAAACCACT 
CTGTCATCCC AGTAGTTTGG GAAGCCGAGG CAGAAGGATT 
GGTAACATAG GGAGACCCCA TCTCTACAAA AAATGCAAAA 
AGTCCCAGCT GCTCGGGAGG CTGAGTGGGA GGATCGCTTG 
TGATTGTACC ATCGCACTCC AGCCTGGGCA ACAGAGTGAG 
AAGGAGAAGG AGAAGAGAAG AAGAAGGAAG AAGGAAAGAG 
AAGGAGGCCT GCTAGGTGCT AGGTAGACTG TCAAATCTCA 
GGAAAGAAAA ACCCCAGCTC TTTGGACTTC CTTAGGCCTG 
ACAAGCGTGT ATGGAGCGAG TGAGTTCAAA GCAGAAAGGG 
GTGACACCAG CCAGGACCCC TGAAAGGGAG TGGTTGTTTT 
TGCACCTGCT GTAACCGTCG ATGTTGGTGC CAGGTGCCCA 
CAAACTTTGG TGGGTTTCAG AAGCCCCAGG CACTTGTGGC 
CCCACGTCCT TCTCCTGGAA CCTGTGAATG TGTCACCCGC 
AATCACGGCT GCCAGTCAGC CGATCTTAAG GTCATCCTGG 
GGTCCCTAGA AGTGAGAGAG GGAGGCAGGG GAGAGTCAGA 
GCTGGCTTTG AGATGGAGGA GGGGGTCCCC AGCCAAGGAA 
AGCAATCCTC CCCGGTCCTG AGGGCACACG GCCCTGCCCA 
TCAGCTTTCC GGCCTCCAGA GCTGTAAGAT GATGCGTTTG 
ACAGCAGCAA ATGGAATAGC AGTACAGGGA AATGAATACA 
CCCCTGGG 



CACCTCTGGC CTCTTCTGGA ACGGAGTCTG 21280 
CCCGGGGACG ACGCTGACTG CCCTGGAGGC 21350 
CTGCACTGAT GGCCACCCGC CCACAGCCAG 21420 
ACGTCCCAGG GAGGGAGGGG CGGCCCACAC 214 90 
TTTGGCCGAG GCCTGCATGT CCGGCTGAAG 21560 
GGGCTGAGTG TCCAGCACAC CTGCCGTCTT 21630 
AGCTTTTCCT CACCAGGAGC CCGGCTTCCA 21700 
TTCACCCCTC GCCCTGCCCT CCTTTGCCTT 21770 
GGGAGCTCTG GGAATTTGGA GTGACCAAAG 21840 
GGGTCCCTGT GGGTCAAATT GGGGGGAGGT 21910 
TTGAAAAAAA TCTCATGTTT GAATCCTAAT 21980 
TGTGAGTGAA CGGGGTGGTG GTCAGTGCGG 22050 
AATGGGGTTG TGGTCAGTGC GGGCCCATGG 22120 
AGGGGAAGGA GGGTAGGGGA TAGACAGTGG 22190 
GAAGGGCAGC AGGGATGCTG GGGGCCCAGC 222 60 
GGGATGATGG GGGCCCCAGC TGGGGTGGCA 22330 
GGGAAGCCTG GCTGGGCCCC CTCCTCCCCT 22400 
GTGCACATCC TCTGGGCCAT CAGCTTTCAT 22470 
TCCAGGATTC CTCCTCCTGA ACGCCCCAAC 2254 0 
AGAGTAGACC AGGATTCTGA TCTCTGAAGG 22610 
CTTCAGGGTG GGGCTGGTGA TGCTCTCTCA 22680 
CATCTCCCAG TCTCATCTGT CTTCCTCTTA 22750 
CTCATCTCTT ATCCTCTTAT CTCCTAGTCT 22820 
TGGAGCTGGA CATACGTCCT TCCTCAGGCA 22890 
CAGAGGGACG CAGTCTTGGG G7GAAGAAAC 22960 
GGGCCCTGCG TGAGTGGCTC CAGAGCCTTC 23030 
TACTGAGTGC ACCTTGGACA GGGCTTCTGG 2 3100 
CTTATGGCCA CTGGATATGG CGTCATTTAT 23170 
GTGTATGGTG GGCCCAAGTC CACAGACTGT 2 3240 
GCTGTGAGGA AGGAGGGGCT CTTGGCAGCC 23310 
GCCCCGGGCG CCGTGGGCGG ACGACCTCAA 2 3380 
CAGAGGCCGC TGCTCAGGCA CACCTGGGTT 2 34 SO 
CATCTTCTAC AAAGCTCCAG ATTCCTGTTT 23520 
ATATTTTTTG CTAAAGTATT AGACCCTTAA 2 3590 
CTACTTTATT TGTCTGTTTT TATTTATTAT 23660 
GTTGTTAGTG CAGTGGCACA GTCATGGCTC 2 3730 
CTCAGCTTCC CAGAGTGCTG GGATTACAGG 23800 
ATGTAAGGTC AGGTCCAGTG GCTTCCACAC 23870 
GTCTGAGGCC AGGAGTTTGA GACCAGCATG 23940 
AGTTATCCGG GCGTGGGGTC CAGCATCTGT 24010 
AGCCCGGGAG GTCATGGCTG CAGTGAGCTG 24080 
ACCCTGTCTC AAAAAAAAAA AAAAAAAAAG 24150 
AAGAAGAAGG AAGAAGGAAG AAAGAAGGAG 24220 
GAGCAAAATG AAAATAACAA ACTTTTAAAG 24290 
AACTTCATCT CAAGCAGCTT CCTTCCACAG 24 360 
AGGAGAAGCA GGCAAGGGTG GAGGGTGTGG 244 30 
CCTGCCTCAG CCCCACGCTC CTGCCGGTCC 24 500 
CCTGGGAAGG ATGCTGTGCA GGGGGCTTGC 24570 
AGGCACAATT ACAGCCCCTC CCCAAAGATG 24 640 
AAGGCAGAGG CTGGTGAAGG CTGCAGGTGG 24710 
ATTATCTGGT GGGCCTGATA TGGCCACAAG 24780 
GAGGGGACGT GAGAAGGACC ACTGGCCACT 24850 
TGGGGGCAGC CGCTCCATGC TGGAAAAGCA 2 4920 
CGCCTCGATT TCAGGCCAGT GGGACCTGTT 24990 
TGTTCAGCCA CTAAGCTGCA GTGATTCGTC 25060 
GGGACAGTTC TCAGAGTGAC TCTCAGCCCA 2 5130 

25138 



Beispiel 5 

Der Vergleich der oben beschriebenen genomischen hTC-Sequenz mit der Sequenz 
der hTC-cDNA (Fig. 6; entsprechend SEQ ID NO 2) ermoglichte die Aufklarung der 
Exon-Intron-Struktur des hTC-Gens. Die genomische Organisation des hTC-Gens ist 
in Fig. 7 schematisch dargesteilt. Die kodierende Region des hTC-Gens setzt sich aus 
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16 Exons zusammen, die in ihrer Gr8i3e zwischen 62 bp und 1354 bp variieren (s. 
Tabelle 1). Exon 1 enthalt das Translationsstartcodon ATG. Das Translations- 
stopcodon TGA sowie der 3' untranslatierte Bereich liegen auf Exon 16 (Fig, 8). Ein 
mogliches Polyadenylierungssignal (AATAAA) wurde weder in Exon 16 noch in 
den 3195 bp der folgenden 3'-flankierenden Region gefunden. Basierend auf der 
Konsensussequenz 

5'-Exon Intron 3'-Exon 

Pra-mRNA A/C A G | G T A/G A . . . N C A G | G 

Hauflgk.(%) 70 60 80 100 lOO 95 70 80 100 100 60 

wurden die Exon-Intron-Ubergange bestimmt und in Tabelle 1 aufgefuhrt. Mit 
Ausnahme der 5*-Splice-Stelle zwischen Exon 15 und Intron 15 stimmen alle Exon- 
Intron-Ubergange mit der publizierten (Shapiro und Senapathy, 1987) Spiice- 
Konsensussequenz uberein. Die Grofie der Introns liegt zwischen 104 bp und 8616 
bp. Da Intron 6 nur zum Teil isoliert wurde, kann die exakte Liinge des hTC-Gens 
nicht bestimmt werden. Basierend auf der von Intron 6 erhaltenen Teilsequenz von 
-4660 bp betragt die minimale GroBe des hTERT Gens 37 kb. 
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Die Introns 1-5 sowie der 5'-Bereich des Introns 6 sind in Contig i enthalten: 
Intron 1 : bp 1 1493-1 1596 (SEQ ID NO 4); 
Intron2: bp 12951-21566 (SEQ ID NO 5); 
Intron 3: bp 21763-23851 (SEQ ID NO 6); 
5 Intron 4: bp 24033-24719 (SEQ ID NO 7); 
Intron 5: bp 24900-25393 (SEQ ID NO 8); 
5 4 -Bereich von Intron 6: bp 25550-26414 (SEQ ID NO 9). 

Der 3*-Bereich des Introns 6 sowie die Introns 7-15 sind in Contig 2 an folgenden 
1 0 Positionen lokalisiert: 

3'-Bereich von Intron 6: bp 1-3782 (SEQ ID NO 10); 

Intron 7: bp 3879-4858 (SEQ ID NO 1 1); 

Intron 8: bp 4945-7429 (SEQ ID NO 12); 

Intron 9: bp 7544-9527 (SEQ ID NO 13); 
15 Intron 10: bp 9600-1 1470 (SEQ ID NO 14); 

Intron 1 1: bp 1 1660-15460 (SEQ ID NO 15; 

Intron 12: bp 15588-16467 (SEQ ID NO 16); 

Intron 13: bp 16530-19715 (SEQ ID NO 17); 

Intron 14: 19841-20621 (SEQ ID NO 18); 
20 Intron 15: 20760-21295 (SEQ ID NO 19). 

Der 3'-nichttranskribierte Bereich befindet sich ebenfalls im Contig 2 an Position 
21960-25138 (SEQ ID NO 20). 



25 



Die genannten Introns haben im einzelnen folgende Sequenzen: 



WO 99/33998 



PCT/EP98/08216 



38 



Intron 1 (SEQ ID NO 4) 

GTGGGCCTCCCCGGGGTCGGCGTCCGGCTGGGGTTGAGGGCGGCCGGGGGGAACCAGCGACATGCGGAG 
CGACTCAGGGCGCTTCCCCCGCAG 

Intron 2 (SEQ ID NO 5) 

GTGAGGAGGTGGTGGCCGTCGAGGGCCCAGGCCCCAGAGCTGAATGCAGTAGGGGCTCAGAAAAGGGGGCAGGCAGAGCC 

CTGGTCCTCCTGTCTCCATCGTCACGTGGGCACACGTGGCTTTTCGCTCAGGACGTC 

TCTGCTCTCCCTCCTGTCCAGTTTGCATAAACTTACGAGGT^ 

CGAGGCCAGAGCAGTGAACAGAGGAGGCTGGGCGCGGCAGTGGAGCCGGGTTGCCGGCAATGG^^ 

CACAG ACG CT CTGGCG AGGGTGCCTG CAGGTTACCTATAAT CCTCTTCGCAATTTCAAGGGTGGGAATG AG AGGTGGGG A 

CGAGAACCCCCTCTTCCTGGGGGTGGGAGGTAAGGGTTTTGCAGGTGCACGTGGTCAGCCAATATGCA^ 

AGATTTAATTGTGTGTTGACGGCGAGGTGCGGTGGCTCACGCCGGTAATCCC^ 

TCACCTGAGGTCAGGAGTTTGAGACCAGCCTGACCAACATGGTGAAACCCTATCTGTACTAAAAATACAAAAAT^ 

GGCATGGTGGTGTGTGCCTGTAATCCCAGCTACTTGGGAGGCTC 

TGCAGTGAGCTGAGATTGTGCCATTGTACTCCAGCCTGGGCGACAAGAGTGAA^ 

CGTTGATTGTGCC^GGACAGGGTAGAGGGAGGGAGATAAGACTGTTCTCCAGCACAGATCCTGGTCCCATCTTTAGGTAT 
G AAG AGGGC CACATGGGAG CAG AGG ACAGCAGATGG CTCCACCTGCTG AGGAAGGG ACAGTGTTTG TGGGTG TTCAGGGG 
ATGGTGCTGCTGGGCC CTGCCGTG TCCCCAC CCTGTTTTTCTGG ATTTGATGTTG AGG AACCTC CG CTC CAG CCC CCTTT 
TGGCTCCCAGTGCTCCCAGGCCCTACCGTGGCAGCTAGAAGAAGTCCCGA 
ATGTAAGACTTCCGGCCATGCAGACAAGGAGGGTGACCTTCTTGGGGCTCT^ 

AAAAG TCAT ATAACATG AG ATTGGCACT C CT AACAC CGTTTT CTGTGTACAGTGCAGAATTG CTAACTCGG CGGTGTTT A 

CAGCAGGTTGCTTGAAATGCTGCGTCTTGCGTGACTGGAAGTCCCTACCCATCGAACGGCAGCTGCCTCACACCTGCTGC 

GGCTCAGGTGGACCACGCCGAGTCAGATAAGCGTCATGCAACCCAGTTTTGCTTTTTGTGCTCCAG 

GAGAGTTTGAGTTCTCTGATCAGGACTCTGCCTGTCATTGCTGTTCTCTGACTTCAGATGAGGTCACAATCTGCCC 

CTTATGCAGGGAGTGAGGCGTGGTCCCCGGGTGTCCCTGTCACGTGCAGGGTGAGTGAGGCGTTGCCCCCAGGTGTCCCT 

GTCACGTGTAGGGTGAGTGAGGCGCGGCCCCCGGGTGTCCCTGTCCCGTGCAGCGTGATTGAGGTGTGGCCCCCGGGTGT 

CCCTGTCACGTGTAGGGTGAGTGAGGCGCCATCCCCGGGTGTCCCTGTCACGTGTAGGGTGAGTGAGGCGTGGTCCCCGG 

GTGTCCCTGTCCCGTCCAGGGTGAGTGAGGCACTGTCCCCGGGTGTCCCTGTCACGTGCA^ 

CCGGGTGTCCCTCTOVGGTGTAGGGTGAGTGAGGCGCGGCC^ 

GTCCCTGGGTGTCCCTCCCAGGTATAGGGTGAGTGAGGCACTGTCCCCGGGTGTCCCTGTCACGTGCAGGGTG 

CGCGGCCCCCGGGTGTCCCTCTCAGGTGCAGGGTGAGTGAGGCGCT 

GAGGCTCTGTCCCCAGGTGTCCTTGGCGTTTGCTCACTTGAGCTTG 

GCGCCGGTTGCCCATTGCCTGGGTAGATGGTGCAGGCGCAGTGCTGGTCCCCAAGCCTATCTTTTCTGATC 

TCTTGGTCACCTCTCCGTTCCATTTTGCTACGGGGACACGGGACTGCAGGCTCTCGCCTCCCGCGTG 

CCACAGCTTGAGGTCCGCTTGCCTCTGTTGGGCCTGGCTrc 

TCTCCCAGCTTGTCTCATGCCGAGGCTGGACTCTGGGCTGCCTGTGTCTGCTGCCACGTGTTGCTG 

AGGGTTCTCTGTGCCCTGAAGGAAAGCAAGTCACCCCAGCCCCCTCACTTGTCCTGTTTTCTCCC 

TTGGCCCCCTTGGGTGGGTGGCAACGCTTCTCACCTTATT 

CCAGTCGCCCCCTCACATGGATTGACGTCCAGCCACAGGTTGGAGTGTCTCTGTCTGTCTCCTGCTCTGAGACCCACGTG 
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G AGGG CCGGTGTCTCCGCCAG C CTTCGT CAG ACTTCC CT CTTGGGT CTT AGTTTTG AATTT CACTG ATTT ACCT CTG ACG 

T TT CT AT CT CT C CATTGT ATG CTTTTT C TTGG TTT ATT CTTT CATT C CTTTTCT AG CTT CTT AG TTT AGT C AT G C CTTT C 

CCTCTAAGTGCTCCCTTACCTGCACCCTGTGTTTTGATC 

ATACTTCAAAGTCTTAATACTTClTlTAAGTATTCTTATTCTGTGAlTrTl^ 

AATCATTTTGATATCAGTX5ACTTTTAAGTATTCTTTAGCTTATTCT 

GTTTATGTTCAAGATATGTAGAGTATCAAGATACGTAGAGTATT^TAAGTTATC 

TGTGTAGTGGTCTXJTATAATACCAATTATTTGAAGTTTGCGGAGCCTTGCTTTGTGATCT 

AA CTG T C C ATTGT AAATTTG AC AT C CTG T CAAT AG TGGG CAT G CATG TT CACT AT AT C CAG CTT ATT AAGG T C C AG TG C A 
AAGCT T C T G T CT C CTT CT AG ATG CATG AAAT T C CAAG AAGG AGG C CAT AG T C C CTCAC CTGGGGG ATGGGTCTGTT CATT 
TCTTCTCGTTTGGTAGCATTTATGTGAGGCATTGTTAGGTGCATGCACGTGGTAGAATTTTTATCTTC 
TCTTTTGGAGACTTCTATGTCTCTAGTAATCTAGTAATTCTTTTTTTA 

TTTG ATTAGT ATTTTCCTG CTGTGTCTGTTTTCTG C CTTTAATTTATATAT ATATAT ATATTTTTTTTTTTTTTG AG ACA 

GAGTCTTGGTCTGTCGCCCAGGGTGAGTGCAGTGGTGTGATCACAGGTCAGTGTAACTTTTACCTTCTGGCCTGAGCCGT 

C CT CTC ACCT CAG C CT CCTG AGTAG CTGG AACTG CAG ACACGCAC CG CTAC AC CTGG CTAATTTTT AAATTTTTT CTGGA 

GAOVGGGTCTTGCTGTGTTGCCCAGGCTGGTCTCAAACTCrTGGACrCAAGGGATCCATCTACCTCGGCTTCCCAAAGTG 

CTGAATTACAGGCATGAGCCACCATGTCTGGCCTAATTTTCAACACTTITATATTCTTATAGTC 

ACAGCATGTAGGTGAATTTCCAATCCAGTCTGACAGTCGTTC 

ACTAGAGACCCGCCTGGTGCACTCTGATTCTCCACTTGCCTGTTGCATGTCCTC^ 

GGTTGCCATGTGCGTTTCCTGCaSAGTGTGTGTTGATCCTCTCGTTGCCTCCTGGTCACT 

CTTTGCTTAGTGTTACCCCCTGATCTTTTTATTGTCGTTGTT^ 

GGCTGGAGTGTAATGGCACAATCTCGGCTCACTGCAACCTCTGCCTCCTCGGT^ 

TGAGTAGCTGGGATTACAGGCGCCCACGACCACGCCTGGCTAATTTTTGTATITTTA 

TGGCC AGG CTGGTCTCAAACTCCTGACCTCAAGTGATCTGCCCGCCTTGGCCTCCCACAGTGCTGGG ATTACH 

GCCACCGTGCCCGGCATACCTTGATCTTTTAAAATGAAGTCTGAAACA^ 

AGTGTATTTTAGCTCTGGCCACCCCCCAGCCTGTGTGCTGTTTTCCCT^ 

CCCCC^CAAGCTAAGCATTATTAATATTGTTTTCCGTGTTGAGTC 

TTTGTTCCCCGTCTGTCTTCTGTCTCAGGCCCGCCGTCTGGG^ 

TTATTGCTGGTAAACCCCAGCTTTACCTGTGCT^ 

ACAGATGAAGATCTGGAGACTC^CGAGGAGGGCGGTCATCTTC^ 

CTTAGCCAGTGAGTGACAGCAACGTCCGCTCGGCCTGGGTTCAGCCTGGAAAACCCCAGGCA 

CCGCC^TGTCGAGTTTGAAATCGCGCAAACCTGCGGTGTGGCG 

CTTCCTCCCTTCTGCTTGGGAACCAGGAGAAA 

ATGTGGATAATTTTAAAATTTCTAGGCTGGGCGCGGTGGCTCACGCCTGTAATCC^ 

TGG ATCACG AGGTCAGGAGGTCGAG ACCATCCTGG CCAACATGATG AAACC CCAT CTGTACT AAAAACAC AAAAATTAGC 

TGGG CGTGGTGGCGGGTGCCTGTAATCCGAGCTACTCGGGAGGCTG AGG CAGGAGAATTGCTTGAACCTGGGAGTTC 

GTTGCAGTGAGCCGACATTGCACCACTGCACTCCAGCCTGGCAACACAGCGAGACTCTGTCTCA 

AAAAAAAAAAAATTCTAGTAGCCACATTAAAAAAGTAAAAAAGAAAAGGTGAAATTAATGTAATAA 

GCCCAGCATGTCCACACCTCATCATTTTAGGGTGTTATTGGTGGGAGCATCACTCACAGGACATTTGACATT 

TTTGTCTGCGGGATCCCGTCTGTAGGTCCCGTGCGTG^ 

GTTGTACCAGATGGTGCAGGTCCGGGATGAGGTCGCCACK3CCCTCAGTC 

TCTGGGATGAGGTCGCCAGGCCCTGCTGTGAGCTGGATGTGTGGTGTCTGGATGG 
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GCCCTCGGTGAGCTGGAGGTATGGAGTCCGGATGATGCAGGTCCGGGGTGAGGTCGCCAGGCCCTGCTGTGAGCTGGATG 
TGTGGTGTCTGGATGGTGCAGGTCAGGGGTGAGGTCTCCAGG 

GGTCCGGGGTGAGGTCGCCAGGCCCTGCTGTGAGCTGGATGTGTGGTGTCTGGATGGTGCAGGTCTGGGGTGAGGTCACC 

AGGCCCTGCGGTGAGCTGGGTGTGCGGTGTCTGGATGGTGCAGGTCTGGAGTGAGGTCGCCAGACGGTGCCAGAC 

GGTGAGCTGGATATGCGGTGTCCGGATGGTGCAGGTCTGGGGTGAGGTTGCCAGGCCCTGCTGTGAGTTGGATGTGGGGT 

GTCCGGATGCTGCAGGTCCGGTGTGAGGTCACCAGGCCCTGCTGTGAGCTGGATGTGTC 

GGGGTGAAGGTCGCCAGGCCCCTGCTTGTGAGCTGGATGTGTC^ 

GCCCTCX3GTGAGCTGGATGTGCAGTGTCCAGATGGTGCAGG 

TGCGGTGTCTGGATGGTGCAGGTCTGGAGTGAGGTCGCCAGGCCCTCGGTGAGCTGGATGTATGGAGTCCGGATGGTGCC 

GGTCCGGGGTGAGGTCGCCAGACCCTGCTGTGAGCTGGATGTGCGGTGTCTGGATGGTACAGGTCTGGAGTGAGGTCGCC 

AGACCCTGCTGTGAGCTGGATATGCGGTGTCCGGATGGTGCAGGTCAGGGGTGAGGTCTCCAGGCCCTCGGTGAGCTGGA 

GGTATGGAGTCCGGATGATGCAGGTCCGGGGTGAGGTCGCCAGGCCCTGCTGTGAACTGGATGTGCGGCGTCTGGATGGT 

GCAGGTCTGGGGTGTGGTCGCCAGGCCCTCGGTGAGCTGGAGGTATGGAGTCCGGATGATGCAGGTCCGGGGTGAGGTCG 

CCAGGCCCTGCTGTGAGCTGGATGTGCGGCGTCTGGATGGTGCAGGTCTGGGGTGTGGTCGCCAGGCCCTCGGTGAGCTG 

GAGGTATGGAGTCCGGATGATGCAGGTCCGGGGTGAGGTTGCCAGGCCCTGCTGTGAGCTGGATGTGCTGTATCCGGATG 

GTGCAGTCCGGGGTGAGGTCGCCAGGCCCTGCTGTGAGCTGGATGTGCTGTATCCGGATGGTGCAGGTCTGGGGTGAGGT 

CACCAGGCCCTGCGGTGAGCTGGTTGTGCGGTGTCCGGTTGCTGCAGGTCCGGGGTGAGTTCGCCAGGCCCT 

TGGATGTGCGGTGTCCCCGTGTCCGGATGGTGCAGGTCCAGGGTGAGGTCGCTAGGCCCTTGGTGGGCTGGATGTGCCGT 

GTCCGGATGGTGCAGGTCTGGGGTGAGGTCGCCAGGCCTTTGGTGAGCTGGATGTGCGGTGTCTGCATGGTGCAGGTCTG 

GGGTGAGGTCGCCAGGCCCTTGGTGGGCTGGATGTGTGGTGTCCGGATGGTGCAGGTCCGGCGTGAGGTCGCCAGGCCCT 

GCTGTGAGCTGGATGTGCGGTGTCTGGATGGTGCAGGTCCGGGGTGAGGTAGCCAAGGCCTTCGGTGAGCTGGATGTGGG 

GTGTCCGGATGGTGCAGGTCCGGGGTGAGGTCGCCAGGCCCTGCGGTTAGCTGGATATGCGGTGTCCGGATGGTGCAGGT 

CCGGGGTGAGGTCACCAGGCCCrGCGGTTAGCTGGATGTGCGGTGTCTGGATGGTGCAGGTCCGGGGTGAGGTCGCCAGG 

CCCTGCTGTGAGCTGGATGTGCTGTATCCGGATGGTGCAGGTCCGGGGTGAGGTCGCCAGGCCCTGCAGTGAGCTGGATG 

TGC7GTATCCGGATGGTGCAGGTCTGGCGTGAGGTCGCCAGGCCCTGCGGTTAGCTGGATATGCGGTGTCGGATGGTGCA 

GGTCCGGGGTGAGGTCACCAGGCCCTGCGGTTAGCTGGATGTGCGGTGTCCGGATGGTGCAGGTCTGGGGTGAGGTCGCC 

AGGCCCTGCTGTGAGCTGGATGTGCTGTATCCGGATGGTGCAGGTCCGGGGTGAGGTCGCCAGGCCCTGCGGTGAGCTGG 

ATGTGCTGTATCCGGATGGTCCAGGTCTGGCGTGAGGTCGCCAGGCCCTGCGGTGAGCTGGATGTGC^ 

TGCAGGTCCGGGGTGAGGTCGCCAGGCCCTGCGGTGGGCTGTATGTGTGTTGTCTGGATGGTGCAGGTCCGGGGTG 

CGCCAGGCCCTGCGGTGAGCTGGATGTGTGGTGTCTGGATGCTGCA^ 

TGGATATGCGGTGTCCCOSTGTCCGAATGGTGCAGGTCCAGGGTGAGGTCGCCAGGCCCT^ 
GTCCGGATGGTGCAGGTCTGGGGTGAGGTCGCCACGCC 

GGGTGAGGTCACCAGGCCCTCGGTGATCTGGATGTGGCATGTCCTTCTCGTTTAAG 

Intron 3 (SEQ ID NO 6) 

GTACTGTATCCCCACGCCAGGCCTCTGCTTCTCGAAGTCCTGGAACACCAGCCCGGCCTCAGCATGCGCCTGTCTCCACT 

TGCCTGTGCTTCCCTGGCTGTGCAGCTCTGGGCTGGGAGCCAGGGGCC^ 

CAAGGCTCTGACTGCCTGGAGCTC^CGTTCTCTTACTTGTAAAATCAGGAG 

AAGCAG AAGGG ATTTAAATT AGATGGAAACACTACCACT AG CCTC CTTGC CTTTC CCTGGGATO 

TCTClTl'riTVlTT C TTlT U TGAGATGGAGTCTGACT 
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G CAAC CT CCAC CT C CTGGG TTT AAGCG ATT CAC CAG C CT CAG C CT C CT AAGT AGCTGGG ATT A CAGG CAC CTG C C ACCAC 

GCCTGGCTAATTTTTGTACTTTTAGGAGAGACCGGGTTTCACCATGTTGGCCAG " 

TGATCCACCCACCTTGGCCTCCCAAAGTGCTGGGTTTACAGGCTAAGCCACCGTGCCCAGCC 

CATGCTGTTCTGTATGAATCTTCAATCTATTGGATTTAGGTCATGAGAGGATAAAATCCCACCCACT^ 

CAGGX3 A^CACCTGTGCAGGGAGCACCTGGGGATAGG A^AGTTCCACCATG AGCTAACTT CTAGGTGG CTGCATTTG AATG 

GCTGTGAGATTTTGTCTGCAATGTTCGGCTGATGAGAGTGTGAGATTGTGACAGATTCAAGCT 

GGACGGGAGCGCTGGTCTGGGAGATGCCAGCCTGGCTGAGCCCAGGCCATGGTATTAGCTTCTCCGT 

TGACTGTGGAGGGCTTTAGTCAGAAGATCAGGGCTTCCCCAGCTCCCCTGCACACTCGAGTCCCTGGGGGGCC 

ACCCCATGCCCCAAATCAGGATGTCTGCAGAGGGAGCTGGCAGCAGACCTCGTCAGAGGTAACA 

GACCCCGACGTGGTGCTGGGGCCATTTCCTTGCATC 

AATGCAC CTTACTTAGACTTTACACGT ATTTAATGGTGTG CG ACCCAACATGGTCATTTC ACCAGT ATTTTGG AAAGAAT 

TTAATTGGGGTGACCOTAAGGAGCAGACAGACGTGGTGGTCCCCAAGATGCTCCTTGTCACTACTGGGACTGTTG 

C CTGGGGGG C CTTGGAGGC CC CTCCT CC CTGG ACAGGGT ACCGTGCCT/TTTCTACT CTGCTGGG C CTGCGGCCTG CGGTC 

AGGGGACCAGCTCCGGAGCACCCGCGGCCCCAGTGTCCACGGAGTGCCAGGCT^ 

GTGGCCGCTCCAGCCCCCGTGCCCCCATGGGTGGTTTTGGGGGAAAAGGCCAAGGGCAGAGGTGTCAGGAGACTG 

C T C ATG AG AG CTG ATT CTG CT CCTTGGCT GAGCTG C C CTG AG CAG C CT CT CCCGCCCTCTCCAT C TG AAGGG ATG TG G CT 

CTTTCTACCTCGGGGTCCTGCCTGGGGCCAGCCTTGGGCT^ 

AGGGGCATGGGTTCACGTGGCCCCAGATGCAGCCTGGGA 

GTTGACCGCCGGACTGGGCX3TCCCCAGGGTTGACTATAGGACCAGGTGTCCAGGTGCCC 
AGGCGTCTGGCTGGCATCGGTGGACGTGGCCCCGGGCAT^ 

TGAGTCGGTGGGGGCTTGTGGCTTCCCX3TGAGCTTCCCCCTAGTCTGTTGTCTC^CTG 

CTATTGCAG 

Intron 4 (SEQ ID NO 7) 

GTGGCTGTGCTTTGGTTTAACTTCCTTTTTAAACAGAAGTGCGTTTGAGC 

CCCGGAG<3AGGGGCCACGGGACACAGCCAGGGCCATGGCACGGCGCCAACCC^ 

TGCCGGTGCCTCCAGAAAAGCAGCGTGGGGGTCTAGGGGGAGCTCCTGGGGCAGGGACAGGCT 

CAGCCX5GGCCAGGGCCTGGATCCAGCACGGCCCGAGGTCCTGGATCCGTC 

TCCGCTTACX3GGGCCCGGGGACCAGGCCACGACTGCCAGGAGCCCACCGGGCTCTC 

CTCCTGCACCCCACCCCTGTGGCTGCGGTGGCTGC^ 

GTGTGGCATGAGGATCCCGTGTGCAACACACATGCGGCCAGG 

TTCTAGGTCCCG<KyrCTGGGTGGCTCGGGACACTGGGGAGGGGCTC 

TTGGCCGGATCCACTTTCCTGACTGTCTCCCATGCTGTCCCCGCCAG 

Intron 5 (SEQ ID NO 8) 

GTGGGTGCCGGGGACCCCCGTGAGCAGCCCTCCTGGACCTTC 

GAGGTACTCCTGGGTGGGCCGCAGGGAGTGCAGGTGACCCTGTC^ 

CTTCAGCCTTTCCTGCAGCACATGGGGCCGACTC 

GATTCCAGTTTCCGTOVGAGAAGGAACCGCAACGGCTCAGCC^ 

GGGTCTCCTGTCCTCAGGCTCAGAGAGGGGACACAGCC03CCCTGCCCTTC 
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AGTGGGGGAC^CCGCCAGGCCAGGCCCTGAGGGCAGAGGTGA 
CTCCACTCACACAG 

5 X -Bereich Intron 6 (SEQ ID NO 9) 

5 GTAAGGTT CACGTGTG ATAGTCGTGT CCAGG ATGTGTGTCTCTGGGATATG AATGTGTCTAG AATG CAGTCGTG T CTGTG 

ATGCGTTTCTGTGGTGGAGGTACTTCCATGATTTACACATCrGTGATATGCGTGTGTGGCACGTGTGTGTCGTG 
GTATCTGTGGCGTGCATATTTGTGGTGTGTGTGTGTGTGGCACGTGTGTGTCCATGGTGTGTGTGCCTGTGGTGTGCA 
TGTGTGTGTCTGTGACACGTGCATGTTCATGCTGTGTGCTGCATGTCTGTGATGTGCCTATTTGTGG 
GTGTCCGTGACATATGCGTGTCTATGGCATGGGTGTGTGTGGCCCCTTGGCCTTACTCCTTCCTCCTCCA 

1 0 GCACCATTGTCCTCACGCTCTCGXX3TGCTGGTTTGGGGAGCTCC^ 

GTCCTGT CACAGGGCTGGG C CTTGGAG ACTGTAAG CCAGGTTTG AG AGGAG AGTAGGG ATGCTGGTGGT ACCTT CCTGG A 
CCCCTGGCACCCCCAGGACCCCAGTCTGGCCTATGCCGGCTCCATGAGATATAGGAAGGCTGATTCAGGCCTCGCTCCCC 
GGGACACACTCCTCCCAGAGCGGCCGGGGGCCTTGGGGCTCGGCAGGGGTGAAAGGGGCCCTGGGCTTGGGTT 
AGTGGTCATGAGCACGCTGGAGGGGTAAGCCCTCAAAGTCGTGCCAGGCCGGGGTGCAGAGGTGAAGAAGTATCCCTGGA 

15 GCTTCGGTCTGGGGAGAGGCACATGTGGAAACCCACAAGGACCTCTTTCTCTGACTTCTTGAGCT 

3 % -Bereich Intron 6 (SEQ ID NO 10) 

TGTG<MATTGGTTTTCATGTGTGGGATAGGTGGGGATCTGTGGGATTG^ 

G CG AG CTTTCTTC CTGTAGTGC^TCTG CAGGTGCTC CAACAGCTTTATTG AGG AGACCAT AT CTTCCTTTG AACT ATGGT 
20 CGGGTTTATAGTAAGTCAGGGGTGTGGAGGCCTCCCCTGGGCTCCCTGTTCTGTTTCTTCCACTCTGGGGTCGTGTGGTG 
CCTGCTGTGGTGTGTGGCCGGTGGGCAGGGCTTCCAGGCCTCCTTGTGTTCATTGGCCTGGATGTGGCCCTGGCT 
CCGTCCTTGGAATTCCCCTGCGAGTTGGAGGCTTTCTTTCTTTCTTTTTTTCTT 

GTCTCGCTCTTTTTTGCCCAGGCTGGAGTGGTTTGGCGTGATCTTGGCTCACTGCAACCTGTGCTTCCTGA 
ATT CTCTTG C CTCAG CCTCCCAAGT AGCTGG AATT ATAGGCG CC CACCAC 
25 AGACGAGGTTTCTCCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAGGTGATCCTCCCACCTCGGCCTCCCAAAGT 
GCTGGGATGACAGGTGTGAACCGCCGCGCCCGGCCGAGACTCGCTTCCTGCAGCTTCCGTGAGATCTGCAGCGATAGCTG 
CCTGCAGCCTTGGTGCTGACAACCTCCGTTTTCCTTCTCCA^ 

CAGAAGAGTTTCACGTGTGCTGATTTCCCGGCTGTTTCCTGCGTAATTGGTGTCTGCT 
TTTCCTTTAGGCTTTGTTTATTGTTGTTTTTCCGGCTCCTTGAA 
3 0 TCTAAACAAGCATCTGAAGTTGCCGTTTTCCCTCTAAAGCAGGGATCCCGAGGCCCCTGGCTGTGG 
G<X»GCCTGTTAGGAACCCG^CGCACAGCGGGAGGCTAGGTGGGGTGTXXKK3AGCCAGCGTTCCC^ 

TCTCAGAT CAGCAGTGGCATGCGGTG CTCAGAGGCG CACACAC CCT ACTG AGAACTGTGCGTGAGAGGGGTCT AG ATTCT 

GTGCTCCTTATGGGAATCTAATGCCTGATX3ATCTGAGGTGGAACCGTTTC 

TCCTGTGGAAAAATCGTCTTCCACXAAACCAGTCCCTGGTACCACAATGG 
3 5 GCAG CCTCTCGTCAGTGTTGAT ATATTGGCrTTTTCTGTG TTG AGT CCAGAATAATT ACGG ATTTCTGTG ATG CTTTC CG C 

CGACCTCAGACCCATGGGCTATTTGTGGGCGTGTTGCCTGCTCCTGGGTTGGGAAG 

GTTACTGCCTTCCAGGTTGGTTCTCAGGGTTGAATCGTACTCGATGTGGTTTTAGCCCAOT 

GGGGCTGGGGAACATGCTGAAGCACAGAGTCACCGTGCGCGTCTTTTGATGCC^ 

TGTTAGTGTGTGTCACGTGCCTGCTCACATCCTGTCTTGGGGACG 
40 GTCCTGGGGGAGTCTGCAGAATAGGAGGTGGGGGTGCCGGTCTCTCTCCCGC^ 
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GTGGCTGCACCTGCATCCCTGCAATCCCTCCAGCA 

GACTGTGGATGGCAGTCGGTCACGGGGGTCTGATGTGTGGTGACTGTGGATGCCGGTTGG 
GTGACTGTGGATGGCOTTCGTGGGGTCTGATGTGGTGACTGT^ 
ATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGGATGGCGGTCGTGGGGTCT 
5 GGGTCTGATGTGGTGACTGTGGATGGCAGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGKjCGGTCGTGGGGTCT 

TGGTGACTGTGGATGGCAGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACT 
GTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTC 

CGGTCGTG<KK»TCTGATGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATC 
CAGGGGTCTGATGTGTGGTGACTGTGG ATGG CGGTCGTGGGGTCTGATGTGTGGTG ACTGTGGATGGTG ATCGG TC ACAG 

10 

GGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTTGGTCCCGGGGG 
TCTGATGTGTGGTGACTGTGGATGGCGATCGGTCACAGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCT 
GATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGGT 
GACTGTGGATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGAT 
GGCGGTTGGTCCCGGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGGATGGCAG 

15 

TCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGG 
TCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGT 
GGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGTGATCGGTCACAGGGGTCTGATGTGTGGT 
GACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGGAT 
GX3CGGTCGTGGGGTCTG ATGTGTGGTGACTGTGG ATGG CGGTCGTAGGGTCTGATGTGTGGTG ACTGTGG ATGG CAGTCG 
20 GTCACAGGGG T CTG ATGTGTGGTGACTGTGG ATGG CGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGG CGGTCGTGG 

GGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTC^ 

GTGGTGACTGTGGATGGTGATCGGTCACAGGGGTCTGATGTGTGGTAGCTGCAGGTGGAGTCCCAGGTGTGTCTGTAGCT 
ACTITGCGTCCTCGGCCCCCCGGCCCCCGTTTCCCAAACAGAAGCTTCCCAGGCGCTCTCTGGGCTTCATCCCGCCATCG 
GGCTTGGCCGCAGGTCCACACGTCCTGATCGGAAGAAACAAGTGCCC^ 
25 ATGCCCTCTCCTCTGCCGGCAG 

Intron 7 (SEQ ID NO 11) 

GTCTGGGCACTGCCCTGCAGGGTTGGGCACGGACTCCCAGCAGTGG 

G ACAGACTGTTGGCCCTGGGGGG CAGTGGGGGGAATGAGCTGTGATGGGGGCATG ATGAGCTGTGTGCCTTGG CGAAAT C 
3 0 TGAGCTGGGCCATGCCAGGCTGCGACAGCTGCT 

CCGCAGTGCCTrTGTTCATCATTTCCTAAATGTCTTCT 

CCTTTAGGAGGGCAGGCCATGTTTGAGCCGTGTCCrrGCCCAGCTGGCCCCT 

TGTCCCCCTTCTTAGGAGGACGGGCCGTGTTTGAGCCACGCCCCGCTGAGCGGGCCTCT 

CWCCCTGTGGCCCTTTGCAGATGTGGTCTGTCCA^ 
35 TCTAGGGGACAGTCGTGTCCACCGCATGAGGCTCAGAGACCTCTGGGCGAATTTCCTTGGCTCCCAGGGTGGGGGTGGAG 

GTGGCCTGGGCTGCTGGGACCCAGACCCTGTGCCCGGC^ 

CGGTGGCCTGTGTGGGTGTGAGCCCAGCTGGACCCACAGGTGGCCCAGAGGAGAC^ 
GCCCATGTGTGTCTGCAGAGACTCGGCCC^CCAGCCCACGATGGC^ 
AAGACTGACCCCAAAAGGGACGGAGGGTCTTGGCCACGT^ 
40 TCTCCCGTCTGCTTTCGCAG 
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Intron 8 (SEQ ID NO 12) 

GTGAGTCAGGTGGCCAGGTGCCATTGCCCTGCGGGTGGCTGGGCGGGCTGGCAGGGCTTCTGCT 
CTTCCCCACTGNCCTTCTGCCCGGGGC^ 
5 TCCCGAGGCCCCGGAAACATXMCra 

GG<^TGTGGAGTTGCTCCTGCOTC^AGGACGAGG^ 

GCAGCTTGTCAGCTCCAAGTTACTACTGACGCTGGACACCCGGCTCrCACACGCTTGTA 
GGATTTTATCCGATTCTCATTCCTGTCCCTGTCGTGTGACCCCCGCGAG<KjCGCGGGCTCTTCTC^ 
CCCATCTGGAAAGTGCGGGGTTGACCGTGTAGTTTGCTCCTCTCGGGGGGCCTGTGGTG<3CCATGGG 
10 GAGAGCTGCCGTCACA.CAGCCACTGGGTGAGCCACACTCA 

CTGGATTTTAAGTAAAACCACACACCTCCCGGCAGGCATCTGCCTGCGACCCTGTGTGTGCCTG^ 
GGAGGAAATTCGTGCACACTCAAGGTCATCAGCAAGGTCATCCGCAGTCAGGTGGAACGTGGAGGCCT 
G T CT C CAGCGG AT AAAGG ACTGTG CACAG CTTCGG AAG CTTTTATTTAAAAATAT AACTATT AATTATT GCATT AT AAG T 
AATCA CT AATGGT AT CAG CAATT ATAAT ATTTATT AAAGT ATAATT AGAAATATT AAGTAGT ACACACG TTCTGGAAAAA 
CACAAATTGCACATGGCAGCAGAGTGAATTTTGGCCGAGGGACACGTGTGCACATGTGTGTAAGCGGCCC 
AGAATTCGCTGACAAAGTCACCTCCCCAGAGAAGCCACCACG<K3CCTCCTTCGTGGTCGTGAATTTTAT^ 
AAGT CACGT AC CGTCCACGTGTGG CAGGGCTTTGGGG AATGTGAGGTG ATGACTG CGTCCTCATG CCCTGACAG ACAGG A 
GGTGACTGTGTCTGTCCTGTCCCTAGCACACGGACAGGCCCGAAGCTCTAGTCCCCATCGTGGTCCAGTT^ 
ATAAAAACGTCTTCAAAACCTGTTGCCCCAAAAACTAAGAACAGAGAGAG 

TCTGCTTGC^TTGACTCGCTGGGCTGGCCGGACTCCTAGAGTTGGTGCGTGTGCTTCTGTGCAAAAAGTGCA 
GCCCATCACTGTGATATCTGCACCAGCAAGGA^GCCTC T ITTCI T TTCTTTCT^'T 
CTGTTGTCTGCCTGGGCTTGAGTGCAGTGGCGCGATCTCAACTCACTGCAACCT 

CTG C CTCAGCCT CCCG AG CAGCTGAG ATTACAGG CACCCAC C CCCTGCG C CTGG CT AATTTTTG TATTTTT AGT AG AGAG 
GGGTTTTTGCCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAGGTGATCCACCCACCTCGG 
2 5 GGATTACAGGTGTGAGCCATC^CGCCCAGCCGGAAAGCCTCTrTTTAAGGTGACCACCTAT^ 
AGGTCTTGTTTTTGCAGTAGGCTOCAAGCGTCTCTTAGCAACAG^AGTGCCGT 
TCGCrGTGGCAGCCATGCCTTCTCTGTGCACCTTTAGGTrCCACGCGGCTATTCTC 

GCAGCGGCTACATGTAGGGTCATGAGTCTTTCACCGTGGACAAATTCCTTG 
30 TCATTCCGGGTCAAGTGTCTGGTTCTGTGAATAAACTCTAAGATTTAAGAAACCTTAATGA 
AGAGCAAGGATGTGGTCACACCTGTC^CTGGATCTGTTTCAGCCGCCCC^ 
TTTGTTCAGAGGTCTCATCTGGTATGTTTCTGAGGTGTTTGCCGGCTGAATGGTAGACGTGT 
TCTGTGTCTGTGTGTGGCTCGGTTTGAGTGTACGCATGTCCAGCACATGCCCT 
CCCAG 

35 

Intron 9 (SEQ ID NO 13) 

GTGAGGCCTCCTCTTCCCCAGGGGGGCTTGGGTGGGGGTTGATTTG 
T CTGG AGACCATXjACTGCTCTGTCTTGAGGAAC CAG ACAAGGTTGCAGCCCC'ITC 
TTGCACAGCCTGAGGACTGCX3GGCTCCACX3CAGGCT 
40 GAGGGCCGCTGCCCTGCATGATGAGCATGTGAATTCAACACC 
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CGTTAGGGTCCTTGGGGAGATGGGGCTGGTG 

CTG GGCGCCTCTTCAGC CCATTG C C CAT CCCACTTG CATGGGGTCT ACACC CAAGG ACG CACACAC CT AAAT AT CGTG C C 
AAC CT AATGTGGTTCAACT CAGCTGG Crri ' l ' ATTGACAGCAGTTACTTTri'TTTTTTTAATACTTTAAGTT CTAGGGT AC 
ATGTGCACGACGTGCAGGTTAGTTACATATGTATACATGTGCCATGTTGGTGTGC^ 
TTAGGTATATCTCCTAATGCTATCCCTCCCC^CTCCCCCCATC^ 
TGTCCAAGTGTTCTCATTGTTCAGTTCCCACCTGTGAGT^ 

GCTCAGAGTGATCGTTTCC1AGCTTCGTCCATGTCCCTACAAAGGACATGAACTCATC 

CCGTGGTGTATATGTGCCACATTTTCTTAATCCAGTCTATCATCGATGGACATTTGGGTTGGTTGCA^ 

GTG AATAGTG C CG CAATAAACATACGTGTGCATGTGT CITTATAGC^GCATGATTT ATAAT CCTTTGGGTATAT AC C CAG 

T AATGGG ATG GCTGGG T CAAATGG T ATTT CT AG TT CT AGATC CTTG AGG AAT CAC CACACTGT CT T C CA CAAT G G T TG AA 

C T AGTTT ACACTCC CAC CAACAGTGTAAAAGTGTTCTGGTGCTGG AGAGGATGTGG ACAG CAGTTATTTTTTT ATG AAAA 

T AGTATCACTG AACAAG CAGACAGTTAGTGAAGGATG CGTCAGGAAGCCTGCAGGCCACACAGCCATTTCTCT CG AAGAC 

TCCGGGTTTTTCCTGTGC^TCTTTTGAAACTCTAGCTCCAATTATAGCATGTACAGTGGATCAAG 

GGTTCAAGTTCTAGATTGAAATAAGTTTATGTAACAGAAAGAAAAA 

GGAAAGTGTCCTa^GCTGGCGGCACACTGGTCAGCCC^^ 

GCTTGGGCCTGAGGGTCACACAGTGCACCATGCCCAGCTTCCTGTGGATAGGATCTGGGTCTCGGATCATGCTGAGGACC 
ACAGCTGCCATGCTGGTAAAGGGCACCACGTGGCTCAGAGGGGGC^^ 

TTATTTTTCCCTAAGAGTCTGAGAAGTGGGGCCGCGCCTGATGGCCTTCGTTCGTCrrCAGCTGGCACAGAATTG 

G CTG ATGG T AAACACTGAGT ACTTAT AATGAATG AGGAATTGCTGT AG CAGTT AACTGTAG AG AG CTCGTCTGTTGG AAA 

GAAATTTAAGTTTTTCATTTAACCGCTTTGGAGAATGTTACTTTATTTATGGCTGTGTAAATTGTTTGACATTC 

TCGTAGACAGATACTACGTAAAAAGTGTAAAGTTAACCTTGCTGTGTATTTTCCCTTATTTTAG 

Intron 10 (SEQ ID NO 14) 

GTGAGGCCCGTGCCGTGTGTCTGTGGGGACCTCCACAGCCTGTGGGCTTTGCAGTTGAGCCCCCCGTGTCCTGCCCCTGG 
CACCGCAGCGTTGTCTCTGCCAAGTCCrrCTCrCTCTGCCGGTGCTGGATCCGCAAGAGCAGAGGCGCTTGGCCGTGCACC 
CAGGCCTGGGGGCGGAGGGGGACCTTCGGGAGGGAGTGGGTACCGTGGA^ 

ACACACGTGGTGAGTGCAGGCGGTGACCTGGCTCCTGCTGCTCTTTGGAAAGTCAAGAGTGGCGGCTCCT^ 

TGAGACCCCCAGGAGCTGTGCACAGGGCCTGCAGGGCCGAGGCGGCAGCCTCC^ 

GAGCAGGAGCTGCTGAGTGAGCTGGCCCACAGCGTTCGCTGCGGTCACGTTCCTGCGTGGG 

AGAATTTG^TTTGCTGAGTGCTGCTGTC^ 

GAAACTAAAATCAGGC^CAGGGGACCTGGCCTGAGGACAG^ 

AGCCGGTGGGCTTGTTITAAAGTGCGATTTGACGAGGGACGAGAAACCrTGAA^ 

TGGCCGCCAGGGGTGCTTTCAGGTGCTTTGCTGGGCTGTG^ 

TCCAGGTCCACCCTCCAGGGCCGCCCTGGGCTGGGG^TATGCCTGGCGTTCCTTGTGCCGCAGCCCGGAGCACAG 
TGTGCACATTTAAATCCACTAAGATTCACTCGGGGGGAGCCCAGGTCCCA^ 

G CTGAGGGG ACAGAGCAG ACGGGG AACG CTGCTTCTGTGTGGCAAGTT CCTG AGGGTG CTGGCCAGGGAGGTGG CTCAG A 

GTGTATGTTGGGGTCCCACCGGGGGCAGAACTCTGTCTCTGATGAGTCGGCAGCCATGTAACAGG 

GGAGCTGGGAATCCACCAGGGGAGCTG<XCAGCTGGCCGAGGTCCGAGGGCCAGGCC^ 

GGGGCCACAGCAGAGGCTOCAGGAAGGGAAGGGGATGCCCAGGCCAGAGCAGAGGCTACCGGGCACAGG 

AGCTGGGTG AGCG AGGCT CATGACT CGG CG AGGGAACCT CCTTG ACGTG AAGCTG ACG ACTGGTGTTG CCCAG CT CACAG 
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CCCAGCCAGGTCCCGCGCCTGAGCAGGAACTCAGAACCCTCCCCTTTGTCTAAAGCACAGCAG 

AGGAGAAAACAGGGAAAGTCGTTGAGAAACGTCTTAAAAGAAGGTGGGATGGTGGCA^ 

GCCCCGGACCACAGATGAGTCTATAACGGGATTGTGGTGTTGCCAT^ 

TGGGGCTGCACCTCCCATCTGAGTCCTGGCTGTCCCGGGTCCAGGCCAGGTTCTTGC^TGCTCAC 
GGGAGACAGGGAAAGCACCCCGAAGTCTGGAGCAGGGCTGGGTCCAGGCTCCTCAGAGCTCCTGCCAGGCCCAGCA 
GCTCCAAATCACCACTTCTCTGGGGTTTTCCAAAGCATTTAACAAGGGTGTCAGGTTACCTCCTGGGTGAC 
TCCTGGGGCTGACATTGCCCCTCTGCCTTAG 

Intron 11 (SEQ ID NO 15) 

GTGAGCGCACCTGGCCGGAAGTGGAGCCTGTGCCCGGCTGGGGCAGGT^ 
TCCGTGTGGGGCAGGCGACTGCCAATCCCAAAGGGTCAGAC^CC^CAGGGTC 

AATGCATCTTTCTGTGGGAGTGAGGGTGCTCACAACGGGAGCAGTTTTCTGTGCTATTTTGGTAAAAGGA 
CAGACCTGGGTGCACTGAGGTGTCTTCAGAAAGCAGTCTGGATCCGAACCCAAGACGCCCGGGCCCTGCTGGGCGTGAGT 
CTCTCAAACCCGAACACAGGGGCCCTGCTGGGCATGAGTCCCTCTGAACCCGAGACCCTGGGGCCCTGCTGGGCGTGAGT 
CTCTCCGAACCCAGAGACTTCAGGGCCCTTTTGGGCGTGAGTCTCTCCGCTGTGAGCCCCACACTCCAAGGCTCATCCAC 
AGTCT AC AGG ATG CCATGAGTTCATGATCACGTGTG ACCCATCAGGGGACAGGGCC ATGGTGTGGGGGGGGT CT CTACAA 
AATT CTG G GGT CTTG TTT C C C CAGAG C C CG AG AGCT CAAGG C CC CG T CT CAGGCT C AG AC AC AAATGAATTG AAG ATG G A 
CA CAG ATG CAG AAATC TGTG CTG T TT CTT TT ATGAAT AAAAAGT AT CAACATT C C AGG CAGGG CAAGG TGG CT C ACACCT 
ATAATCCCAGCACTTTGGGAGGCCGAGGTCGGTGOATCACTTGAGGCCAGG^ 
AAA.TTCCATTTCTACTTAAAAAATACAAAAATTAGCCTCGCCT 

TGAGGCAC^AGAATCATTTGAACCCAGGAGGCAGAGGTTGCAGTGAGCCGAGATCACACCACTGCACTCCAGCCTGGGCA 

ACAG AGTGAGACTT CATCTT AAAAAAAAAAAAAAAAGTATCAGCATCCCAAAACCAT AGTGGA C 

TGT C CTTCG ATAATATTTACTGGTGCTGTG CTAG AGGC CGGAACTGGGGGTG CCTTCCT CTGAAAGGCAC ACCTTCATGG 

G AAG AG AAAT AAGTGK3TG AATGGTTGTTAAACCAGAGGTTTAAACTGGGGTCCTGTCGTT CTGAG TTAACAGTCCAG ATC 

TGGACTTTGCCTCTTTCCAGAATGCTCCCTXXK3GTTTGCTTCATGGGGG 

GAGCAGCAGGTGCAGACGCCCTCATGATXXX3GGAGTGGCAGGTGCAGAC^ 

TTCCAGCTCCCTCCCCACAAGGATGCCGGTCTCCTC 

CTGGCCTCCACTGGCTTTCTCTGCATGATTTCCAC^^ 

GCAGTGCTC*GCCATACCAGTCAGCTGTGAACTGTCGACTGCT 

ACCCCTGGTTCCAGCCTCTGGCAC^GCATCAGTGAATGT^^ 

GTTCTCTCTAAACACATTGCAAAGCCACAGAGGCTAGTGCAC^A^ 

CCAGAATATTCTGTGCTCCCAAAGGCCACTrGGTCAGAGTGTGTGCTTGCAGAGGT 

GCAGTGGTTCGCCATACTCAGGGTGAACTCACATCCTCTGTGTCTGAAGTATA 

GAAGAAAACAGGCAAAATGATTAAGAAAAGTGAAAAAGGAAAAGTGGTAAG 

TC CCAAACCACAGCTCAGATGGT AG AATCTGGTCAGAACTGATGG ACAG AACA^ 

CAG AAACGTGTGTTAATGTGGT ATGTGG CACAG CTGATGGAAAAGAGAGTG TGTGTGT AATTTTTTTTTCTG AG AAAACT 
GACTGGAAG CAAATAAGTTGTGTCTTTACAGCAT AT AC CAGAG CAGATTCT AGGTAG AAGAGG AG ACAC ATG CAAACAAC 
ACCAGCAACAGAAATAAAACAAAAGACTCAAAGGGAAGGGAGGTGAACGTTCCCTGGTTTGGTC 
AGGGAGGCGGATGAAACCAGTGAGGCAACGCX3CATTGCTTTCACTGCAGAGAAACTCAGCTTGCCT 
ATCGCCATTCCCTGGAGCGTTTGTGCACGTGATTTATTTAAGGCGCCCTCTGAGGTCCTC 
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GTTCTCCTAACCACCTGAGAGGTAGAGGAGGAAA^ 

ATGCATGATTGCAGCCTGGCCTCCTGCTCCGGGGCCCTTGCTCTGCCCGAGGACCCCACACAAG 
AGGGTGAGCCGGAGCCCAAGGTCGTGTTGGGGATGGCTGTGAAAGA^^ 
CTACCAGCAGCGTCAAAGAAATGCATGTGAAACTGACAGCGAGACCCATCCCTCAAAGA 
5 GAGACCTGTCCCCATCCCTCATGCTGGCTCCTrTTCTGGGCTTGCCAAGAGCCAGCA 
ACTTTTCTGGAAAGCAGCTTGTTTGCATGGAAGTCCT 

C CAG ACATTAT CACGGGT CTT ATTTACCATTTCCAGTGTTCCAGGCAGGGGG ACTTG CCACAGCAAGTCA 
CAAAT ACAGGGCT AAGGAG ATATT ATG CATCACAAAACTTG CT CTGCCATTAAACATTTTTCAAAG AATTTTTG AAGAAT 
GTTT AATGGCACAAAACGTTTATTTCAATGTAG CAGTGTTC AAAGCTGGATGTAAAAGAACACAC C CCAGG AG CCTG CCG 
1 0 TGAATGTCATGTGTGTTCATCTTTGGACATGGACATACATGGGCAGTGAGTGGTGGTGAGGCCCTGGAGGA 
GATGCCTCCATCCTGCCCCTCTGGAGACACCATGTGTGCCACGTGC^ 
GCTCTTCCATCCCTGAGATTCAAACACAGTGAGATTCCCCACGCCCAACTCAGTGTTCT 

ACCTGTG TT CACTCG AGGGACGCCCGGG AGCCAGGG CTCGkCAGTTT ATTATC C 
TCATCAGGGCAGATGATGAGTGCACAAACACGGCCGTGCGAGGTTO 
15 GAGTTTGGTCATGCAGAGTCTGGATGGCATGTAGCATTTGGAGTCCATGGAGTGAGCACCCAGCC 

G CATGCCC C AGG CAGG ACAAGGAAG CGGGAGGAAGGCAGGAGG CTCTTTGG AGCAAG CTTTGCAGGAGGGGGCTGGGTGT 
GGGGCAGGCACCTGTGTCTGACATTCCCCCCTGTGTCTCAG 

Intron 12 (SEQ ID NO 16) 

20 GTGAGCAGGCTGATGGTCAGCAC^AGTTCAGAGTTCAGGAGGTGTGTGCGCAAGTATGTGTGTGTGTGTGTGCGCGCGT 
G CCTG CAAGG CTG ATGGTG ACTGG CTGCACGTAAG AGTG CACATGTACGCATATACACGTGAG CACAT ACATGTGTGCAT 
GTGTGTACATGAAGGCATGGCAGTGTGTGCACAGGTGTGCAAGGGCACAAGTGTGTGCACAT^ 

TGCATGTGTGTTCGTGCACAGTCGTGTGGGCATTCACGTGAGGTGCATGCGTGTGGGTGTGCAGTGTGAGTAGCATGTGT 
G CACATAACATGTATTG AGGGGTCCTCGTGTTCACCCCG CTAGGT CCTC AGCACCAGTG CCACTCCTT ACAGG ATGAG AC 
25 GGGGTCCCAGGCCTTGGTGGGCTGAGGCTCTGAAGCTGCAGCCCTGAGGGCATTGTCCCATCrGGGCATCCGCGTCCACT 
CCCTCTCCTGTGGGCTTCTGTGTCCACTCCCCCTCTCCTGTGGGCATTTACATCCACTCCACTCCCTCTCTCCTGTGGGC 
ATCCGCGTCCACTCCCCCTCTCTGTGGGCATCTGCGTCC^ 
GGTTCCTTCCTGTCTTGGCCGAGCCTCGGG{X5CAGG(^GATGA 

CCGGGTGAGGGCCAGGCCGGATTTCACTGGGAAGAGGGATAGTTTCTTGTCAAAATOTTCCT 
3 0 ATGGATGATAAAGCAAAAAGTAAAAACTTAAAATCCCAGAGAGGTTTCTACC 

Intron 13 (SEQ ID NO 17) 

GTGAGCCGCCACCAAGGGGTGCAGGCCCAGCCTCCAGGGAC 
TX3GAACTCCTGGGTTTTAGGGGCAAGGAATGTCTTACGT 

35 GCTCTGTGCAAAGCACCrGTTCTCCATCTCTC 

GCACTGGCCGTOTGACGTCATGGAGGCCATCCCAGGGCAGCAGGGGCATGGGGTAAAGAGATGTTT 
CAGAGGAGGCTGGCAAGGTGTCTGAACAGTAGATGGGAGATCAGATGCCCGGAGGATTTGGGGTCTCAGCAAAGAGGGCC 
GAGGTGGGTGCAGGTGAGGGTCGCTGGCCCCACCCCCGGGAAGGTGCAGCAGAGCTGTGGCT 
GCACCTGTGCTCrrGGGCATGGCTGTGCTCCTGGAACGTTCCCTGTCCTGGCT 

40 ACAACTTT ATCACAGAGGG AAGGGC CAATCTGTGG AGGC CACAGGG CCAG CTTCTG CCTGGAGTCAGGG CAGGTGGTGG C 
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ACAAGCCTCGGGGCTGTACCAAAGGGCAGTCGGGCACCACAGGCCCGGGCCTCCACCTCAACAG^ 
GGAGCTGAATGCCAGGAGGCCGAAGCCCTCGCCCCATGAGGGCn'GAGAAGGAGTGTGAGCATTTGTGTTAC 
AGGCTGCGCGAATTACCGTGCACACTTGATGTGAAATGAGGTCGTCGTCTATCGTGGAAACCCAGCAAGGGCTCACGGGA 
GAGTTTTCGATTACAAGGTCGTACCATGAAAATGGTTTTTAACCCGAGT^ 

5 AGAGCCACAGCTGCATGTTACCGCCTTTGCACCAGCTCCAGAGGCTTGGGACCAGGCTGTCTCAGTTCCAGGGTGCGTCC 
GG CTCAG ACCG C CCTC CTCTCTG C CTTCTCT CTCTG C CT C AAAT CTTC CCTCGTTTG CATCT C C CTG ACG CG TG CCTGGG 
CCCTCGTGCAAGCTGCTTGACTCCTTTCCGGAAACCCTTGGGGTGTGCTGGATACAGGTGCCACTGAGGACTGGAGGTGT 
CTGACACTGTGGTTGACCCCAGGGTCCAGCTGGCGTGCTTGGGGCCTCCTTGGGCCATGATGAGGTCAGAGGAGTTTTCC 
CAGGTGAAAACTCCTGGGAAACTCCCAGGGCCATGTGACCTGCCACCT^ 

10 ATTTCCCCACCAGGGTCTCTAGCTCCGAGGAGCTCCCGTAGAGGGCCTGGGCTCAGGGCAGGGCGGCTGAGTTTCCCCAC 
C CATG TGGGG ACCCTTGGGTAGTCG CTTG ATTGGGTAG C CCTG AGG AGGC CGAG ATG CGATGGG CCACGGGCCGTTTCCA 
AACACAGAGTCAGGCACGTGGAAGGCCCAGGAATCCCCTTCCCTCGAG<3CAGX3AGTGGGAGAACGGAGAGCTGG<3CCCCG 
ATTTCACGGCAGCCAGGCTGCAGTGGGCGAGGCTGTGGTGGTCCACGTGGCGCTGGGGGCGGGGTCTGATTCAAATCCGC 
T GGGG CT CGG C CTTCCTGGC CCGTG CTGG CCG CG CCT C CACACGGG CTTGGGGTGG ACGCCC CG ACCTCTAG CAGGTGG C 

15 TATTTCTCCCTTTGGAAGAGAGCCCCTCACCCATGCTAGGTG 

CCGGGACCTTAGGCTTATTTATTTGTTTAAAAAC^TTCrGGGCCTGGCTTCCGTTGTTGCTAAA 

CACCT CAG CAGAGTT ACTG AG AGGCTG AAACCGGGGTG CTGG CTTG ACTGGTGTG AT CT CAGGTCATT C CAG AAGTG GCT 
C AGG AAGT CAGTG AG ACCAGGTACATGGGGGGCTCAGG CAGTGGGTGAG ATG AGGT ACACGGGGGG CTCAGGCAG TGGG T 
GAGGCCAGGTACATGGGGGGCTCAGGCACTGGGTGAGATGAGGTACACGGGGGGCT^ 
20 ACGGGGGCTCTGATCACACGCACATATGAGCACATGTGCACATGTGCrGTTTCATGGTAGC 
CCCAAAGTCCCAGGAAGCTGAGAGGCCAAAGATGGAGGCTGAGAGGGCT 

CTTTGGGAGGCCGAG<3CGAGAGGATCCCTTGAGCCCAGGAGTTrAAGACCAGCCTGAGCAACATAGTAGAACCCCATCTC 
TATGAAAAATAAAAAO^AAAATTAGCTGAACATGGTC^TGTGCGCCTGTAGTTCCA^ 

GATCACTTGAGCCCAGGAGGTGGAAGCTGCAGTGAGCTGAGATTGCACCACTGTACTGCAGCCTGGGTGACAGAGTGAGA 

2 5 G CCCATCTCAACAACAACAAAG AAG ACTG ACAAATGCAGTTT CTTG 

CAGAAGCCAAGTCGGTGTCTCGGTGTCAGTGAGATGAGATGATGGGTCCTCACACCATCACCCCAGACCCAGGGTTTATG 
CACCACAGGGGCGGGTGGCTCAGAAGGGATGCGCAGGACGTTGATATACGATGACATCAAGGTTGTCTGACGAAGGGCAG 
G ATTCATG ATAAGTACCTG CTGGTACACAAGGAACAATOT ATAAACTG^ AAACCTT AG AC^CCTTCCCG^ AACAGGGG CT 
AAT CAGAAGCCAG CATGGGGGGCTGG CATCCAGGATGG AGCTG CTTCAGCCTCCACATGCGTG TT CATACAG ATGGTGCA 

3 0 C AGAAACGCAGTGTACCTGTGCACACACAG ACACGCAG CTACTCG CACACACAAGCACACAC ACAGACATGCATG CATG C 

ATCCGTGTGTGTG CACCTGTGCCCATG AGGAAACCCATG CATGTGCATTCATGCACGCACACAGG CACCGGTGGG C CCAT 
GCCCACACCCA(3xAGCACCGTCTGATTAGGAGGCCTTTCCTCTGA 

Intron 14 (SEQ ID NO 18) 

35 GTATGTG C AGGTG CCTGGC CT CAGTGG CAGCAGTG C CTGCCTG CTGGTGTT AGTGTGTCAGG AG ACTG AGTG AAT CTGGG 

CTTAGGAAGTTCTTACCCCTTTTCGCATCAGGAAGTGGTTT^ 

GGC^TGAGC^GAGCACCTGATGGAAC^GACAGGAGCTGTCTGGGAGCTGCCATCCTTCCCACCTTGCTCTGCCTGGGGAA 
GCGCTGGGGGGCCTGGTCTCTCCTGTITGCCCCATGGTGGGATTTGGGGGGCCTGGCCTCTCCT 
GATTGGGCTGTCTCCCGTCCATGGCACTTAGGGCCCTTGTC 
40 GCTACCCCACCCCTCTCAGGAGCAGAGGCCGCGTATCACCACGACAGAGCCCC^CGCCGTCCTCTGCTTCCCAGTCACCG 
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TCCTCTGCCCCTGGACACTTTGTCCAGCATCAGGGAGGTTTCTGATCCGTCTGAAATTCAAGCCATGTCGAA 

CCTGAG CTTAACAGCTTCTACTTTCTGTTCTTT CTGTGTTGTGG AAATTT CAC CTGG AG AAG CCG AAGAAAACATTTCTG 

TCGTGACTCCTGCGGTGCTTGGGTCC^ACAGCCAGAGATGGAGCC^^ 

GTGTCTCCTGGGAGGGGAGCTGGGCTGGGCCTGTGACTCCTCAGCCTCTGTTTTCCCCCAG 

5 

Intron 15 (WEQ ID NO 19) 

GCAAGTGTGGGTGGAGGCCAGTGCGGGCCCCACCTGCCCAGGGGTCATCCTTGAACGCCCTGTGTGGGGCGAGCAGCCTC 
AGATGCTGCTGAAGTGCAGACGCCCCCGGGCCTGACCCTGGGGGCCTGGAGCCACGCTGGCAGCCCrrATGTGATTAAA 
CTGGTGTCCCCAGGCCACGGAGCCTCKSCAGGGTCCCC^ 
1 0 CCACGCTTGGGAGCCTTCTGACCCCTGACCTGTG 

CCTGAGCAAGTTCTCTCCCCGCCCCGCCGCTCCAGCGTCACT^ 

TCCCTTCACTGAGGTTCCCACCAGCCAGGGCCACGAGGTGCAGGCCCTGCCTGCCCGGCCACCCA 
TTGGAGGATGCCACCTCTGGCCTCTTCTGGAACGGAGTCTGATTTTGGCCCCGCAG 

15 3 * -untranskribierter Bereich (SEQ ID NO 20) 

ATCTCATGTTTGAATCCTAATGTGCACTGCATAGACAC 

GGTCAGTGCGGGCCCATGGCCTGGCTGTGCATTTACGGAAGTCTATGAGTGAATGGGGTTGTGGTCAGTGCGGGCCCATG 
GC CTGGCTGGG CCTGGGAGGTTTCTG ATG CTGTG AGGCAGGAGGGG AAGG AGGGTAGGGGATAG AC AGTGGG AG CCCCCA 
CCCTGGAAGACATAACAGTAAGTCCAGGCCCGAAGGGCAGCAGGGATGCTGGGGGCCCAGCTTGGGCGGCGGGGATGATG 

20 GAGGGCCTGGCCAGGGTGGCAGGGATGATGGGGGCCCCAGCTGGGGTGGCAGGGGTGATGGGGGGGGCTGGTCTGGGTGG 
CGGGGAAGATGGGGAAGCCTGGCTGGGCCCCCTCCTCCCCTGCCTCCCACCTGCAGCCGTGGATCCGGATGTGCTTCCCT 
GGTGCACATCCTCTGGGCCATCAGCTTTCATGGAGGTGGGGGGCAGGGGCATGACACCATCCTGTATAAAATC 
CCTCCTCCTGAACGCCCCAACTCAGGTTGAAAGTCACATTCCGCCTCTGGCCATTCTCTTAAGAGTAGACCAGGATTCTG 
ATCTCTGAAGGGTGGGTAGGGTGGGGCAGTGGAGGGTGTGGACACAGGAGGCTTCAGGGTGGGGCTGGTGATGCTCTCTC 

25 ATCCTCTTATCATCTCCCAGTCTCATCTCTCATCCT 

CTCATCTGTCATCCTCTTACC^TCTCCCAGTCTCATCTCTTATCCrrCTTATCTCCTAGTCT 

GGGCGGGTG CCAGGCTCG CAGTGG AG CTGGACATACGTCCTTCCTCAGG CAG AAGGAACTGG AAGG ATTG CAG AG AACAG 
GAGGGGCGGCTCAGAGGGACGCAGTCTTGGGGTGAAGAAACAGCCCCTCCTCAGAAGTTGGC^ 

AGGGCCCTGCGTGAGTGGCTCCAGAGCCTTC CAGCAGGTCCCTGGTGGGGCCTTATGGT ATGG CCGGGT C CT ACTG AGTG 
30 CAC CTTGG ACAGGG CTTCTGG TTTG AG TG CAG C C CGG ACGTG C C TGGTGT CGGGG TGGGGG C TT ATGG C CACTGG AT ATG 

G CGT CATITATTG CTGCTCCTTCAGAGAATGTCTGAGTGACCXSAG CCTAATGTC C CAC AG ACTG 

TGTCGTAAATGCACTCTGGTGCCTGGAGCCCCCGTATAOJGAGCTGTGAG^ 

GCGC CTTTGCCCTGCAAACTGG AAGGGAG CGGCCCCGGG CGCCGTGGGCGGACGACCTCAAGTG AG AGGTTGG ACAGAAC 
AGGGCGGGGACTTCCCAGGAGCAGAGGCCGCTGCTCAGGCACACCTGGGTTTGAATCACAGACCAACaGGTCAGGC 

3 5 GTTCAG CTATCCATCTTCTACAAAG CTCCAGATTCCTCTTTCTC CGGGTGTTTTTT G TTG AAATTTTACT CAGG ATTACT 

TATATTTTTTGCTAAAGTATTAGACCCTTAAAAAAGGTATTTGCTTTCATATGGCTTAACTCA 
TTGTCTGTTTTTATTTATTATTATTATTATTATTAGAGATGGTGTCTACT 
AGTCATGGCrCGCTGTAGCCGCAAACCCCCAGGCTCAAGTGATCCrCaKSCCT 
GTGTGAGCCACTGCCCrTGCCTGGCACTTTTAAAAACCACrATGTAAGGTCAGGTCC^ 

40 CAGTAGTTTGGGAAGCCG AGG CAG AAGG ATTGTCTG AGGCCAGG AGTTTG AG ACCAG CATGGGTAACATAGGG AG ACCCC 
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ATCTCTACAAAAAATGCAAAAAGTTATCCGGGCGTGGGGTCCAGCATCTGT^ 

AGGATCGCITGAGCCCGGGAGGTCATGGCTGCAGTGAGCTGTGATTGTACCATCG CACTCCAGCCTGGG CAACAGAGTGA 
G ACC CTGTCTCAAAAAAAAAAAAAAAAAAAG AAG^ AGAAGGAG AAG AG AAG AAG AAG 

G AAG AAGGAAGAAAG AAGG AG AAGG AGGCCTGCTAGGTG CT AGGTAG ACTGTC AAATCTCAG AG CAAAATG AAAAT AACA 
5 AAGTTTTAAAGGGAAAGAAAAACCCCAGCT CTTTGGACTTC CTTAGG CCTGAACTT CATCTCAAG CAGCTTCCTTC CACA 

G ACAAGCGTGT ATGG AG CG AGTG AGTTCAAAG CAGAAAGGG AGGAG AAGCAGGCAAGGGTGGAGG CTGTGGGTG ACACCA 
GCCAGGACCCCTGAAAGGGAGTGGTTGTTTTCCTGCCTCAGCCC 

GATGTTGGTGCCAGGTGCCCACCTG<3GAAGGATGCTGTGCAGGGGGCTTGCCAAACTTTGGT 
GCACTTGTGGCAGGCACAATTACAGCCCCTCCCCAAAGATGCCCACGTCCTTCTCCTGGAACCTGTGAATC 
10 CAAGG CAGAGG CTGGTGAAGGCTG CAGGTGGAATCACGGCTGCCAGTCAG C CG ATCTT AAGG TCAT CCTGG ATT ATCTGG 

TGGG CCTG AT ATGG CCACAAGGGTC CCT AG AAGTG AG AG AGGGAGG CAGGGG AG AGTC AG AG AGGGGACGTG AG AAGG AC 
CACTGGCCACTGCn'GGCrTTTGAGATGGAGGAGGGGGTCCCCAGCCAAGGAATGG^ 
AAGCAATCCTCCCCC^TCCTGAGGGCACACGGCCCTGCCCACGCCTCGATTT 

CGGCCTCCAGAGCTGTAAGATGATGCGTTTGTGTTCAGCCACTAAGCTGCAGTGATTCGTCACAGC^ 
1 5 CAGTACAGG^AAATGAATACAGGGACAGTTCTCAGAGTGACTCTCAGCCCACCCCTGGG 
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Die Charakterisierung der Exons zeigte interessanterweise, dafi die in unserer 
Patentanmeldung PCT/EP/9 8/03 469 beschriebenen, funktionell wichtigen hTC- 
Protein-Domanen auf separaten Exons angeordnet sind. Das Telomerase- 
5 charakteristische T-Motiv befmdet sich auf Exon 3. Die fur die katalytische Funktion 
der Telomerase wichtigen RT (Reverse-Transkriptase)-Motive 1-7 liegen auf 
folgenden Exons: RT Motiv 1 und 2 auf Exon 4, RT Motiv 4 auf Exon 9, RT Motiv 5 
auf Exon 10, RT Motiv 6 und 7 auf Exon 11. RT Motiv 3 liegt verteilt auf Exon 5 
und 6 vor (s. Fig. 8). 

10 

Die Aufklarung der Exon-Intron-Struktur des hTC-Gens zeigt auch, dafi die in 
unserer Patentanmeldung PCT/EP/98/03469 beschriebenen vier Deletions- bzw. 
Insertions-Varianten der hTC-cDNA ebenso wie drei weitere, in der Literatur (Kilian 
et ai., 1997) beschriebene hTC-Insertions-Varianten hochstwahrscheinlich alternative 
15 Splice-Produkte darstellen. Wie in Fig. 8 gezeigt, lassen sich die Splice Varianten in 
zwei Gruppen einteilen: Deletionsvarianten und Insertionsvarianten. 

Den hTC-Varianten der Deletionsgruppe fehlen spezifische Sequenzabschnitte. Die 
36 bp in frame Deletion in Variante DELI resultiert hochstwahrscheinlich aus der 

20 Benutzung einer alternativen 3 4 -Splice Akzeptorsequenz in Exon 6, wodurch ein Teil 
des RT Motivs 3 verlorengeht. In Variante DEL2 vverden die normalen 5 '-Splice 
Donor- und 3* -Splice- Akzeptor Sequenzen von Intron 6, 7 und 8 nicht benutzt. 
Stattdessen wird Exon 6 direkt an Exon 9 fusioniert, wodurch eine Verschiebung des 
offenen Leserahmens entsteht und in Exon 10 ein Stopcodon auftritt. Variante Del3 

25 stellt eine Kombination aus Variante 1 und 2 dar. 

Die Gruppe der Insertions-Varianten zeichnet sich durch die Insertion von 
Intronsequenzen aus, die zu vorzeitigen Translationsstop filhren. Anstelle der 
normalerweise benutzten 5'-Spiice Donorsequenz von Intron 5 wird eine alternative, 
30 3 t -lokalisierte Splicestelle in Variante INS1 benutzt, wodurch eine Insertion der 
ersten 38 bp aus Intron 4 zwischen Exon 4 und Exon 5 entsteht. Ebenso resultiert die 
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Insertion eines Intron 1 1-Sequenzbereichs in Variante INS2 aus der Benutzung einer 
alternativen 5 '-Splice Donorsequenz in Intron 1 1. Da diese Variante in der Literatur 
(Kilian et al., 1997) nur unzureichend beschrieben wurde, lafit sich die genaue 
alternative 5'-Splice Donorsequenz dieser Variante nicht bestimmen. Die Insertion 
5 von Intron 14 Sequenzen zwischen Exon 14 und Exon 15 in Variante INS3 entsteht 
durch die Benutzung von einer alternativen S'-Splice Akzeptorsequenz, wodurch der 
3 4 -Teil von Intron 14 nicht gesplict wird. 

Die in unserer Patentanmeldung PCT/EP/98/03469 beschriebene hTC-Variante INS4 
10 (Variante 4) zeichnet sich durch den Ersatz von Exon 1 5 und dem 5 t -Teilbereich von 
Exon 16 durch die ersten 600 bp des Introns 14 aus. Diese Variante ist auf den 
Gebrauch einer alternativer internen 5'-Splice Donorsequenz in Intron 14 und einer 
alternativen 3 '-Splice Akzeptorsequenz in Exon 16 zuruckzufuhren, woraus ein 
veranderter C-Terminus resultiert. 

15 

Die in v/vo-Generation vvahrscheinlich nicht-funktioneller hTC-Proteinvarianten, die 
mit der Funktion des vollstandigen hTC-Proteins interferieren konnten, stellt 
zusatlich zur Transkriptionsregulation einen moglichen Mechanismus dar, um die 
hTC-Proteinfunktion zu kontrollieren. Bis heute ist die Funktion der hTC- 
20 Splice varianten nicht bekannL Obwohl die meisten dieser Varianten vermutlich fur 
Proteine ohne Reverse-Transkriptase-Aktivitlt kodieren, konnten sie dennoch eine 
entscheidende Rolle als transdominant-negative Telomerase-Regulatoren spielen, 
indem sie z.B.um die Interaktion mit wichtigen Bindungspartnern kompetieren. 

25 Die Suche nach moglichen Transkriptionsfaktorbindungstellen wurde mit dem „Find 
Pattern u -Algorithmuses aus dem „GCG Sequenz Analysis" Programmpacket der 
„Genetics Computer Group" (Madison, USA) durchgefuhrt. Dadurch vvurden 
verschiedene potentielle Bindungsstellen fiir Transkriptionsfaktoren in der 
Nukleotidsequenz von Intron 2 identifiziert, die in der Tab. 2 aufgelistet sind. 

30 Daruberhinaus wurde im Intron 1 eine Spl-Bindungsstelle (Pos. 43) und im 5'- 



WO 99/33998 



PCT/EP98/08216 



53 

untranslatiertem Bereich eine c-Myc-Bindungsstelle (cDNA-Position 29-34, vergl. 
Fig. 6) gefunden. 

Beispiel 6 

5 

Urn den oder die Startpunkt(e) der hTC-Transkription in HL 60 Zeilen zu ermitteln, 
wurde das 5'-Ende der hTC-mRNA durch Primer-Extension-Analyse bestimmt. 

Es wurden 2 ug PoiyA + -RNA aus HL-60-Zellen fur 10 min bei 65°C denaturiert. Zur 

10 Primeranlagerung vvurden I ul RNasin (30-40 U/ml) und 0,3-1 pmoi radioaktiv 
markierter Primer (5'GTTAAGTTGTAGCTTACACTGGTTCTC 3'; 2,5-8x1 0 5 
cpm) zugegeben und fiir 30 min bei 37°C in einem Gesamtvo lumen von 20 ul 
inkubiert. Nach Zugabe von 10 ul SxReverse Transkriptase-Puffer (Fa. Gibco-BRL), 
2 ul 10 mM dNTPs, 2 pi RNasin (s.o.)> 5ul 0,1 M DTT (Fa. Gibco-BRL) 2 ul 

15 ThermoScript RT (15 U/ul; Fa. Gibco-BRL) und 9 ul DEPC-behandeltes Wasser 
erfolgte die Primer-Verlangerung in einem Gesamtvolumen fur 1 h bei 58°C. Die 
Reaktion wurde durch 4 ul 0,5 M EDTA, pH 8,0, gestoppt und die RNA nach 
Zugabe von 1 ul RNaseA (10 mg/ml) fur 30 min bei 37°C abgebaut. Hierauf vvurden 
2,5 ug gescherte Kalbsthymus-DNA und 100 ul TE addiert und einmal mit 150ul 

20 Phenol/Cloroform (1:1) extrahiert. Die DNA wurde unter Zusatz von 15 ul 3 M Na- 
Acetat und 450 ul Ethanol fUr 45 min bei -70°C gefallt und anschlieBend fiir 15 min 
bei 14000 Upm abzentrifugiert. Das Prazipitat wurde einmal mit 70 %igem Ethanol 
gewaschen, Iuftgetrocknet und in 8 ul Sequenzierungs-Stoplosung gelGst. Nach 5 
min Denaturierung bei 80°C wurden die Proben auf ein 6 %iges Polyacryiamidgel 

25 aufgetragen und elektrophoretisch (Ausubel et al., 1987) aufgetrennt (Fig. 5). 

Hierbei wurde eine Haupt-Transkriptionsstartstelle identifiziert, die 1767 bp 5' vom 
ATG-Startcodon der hTC-cDNA Sequenz lokalisiert ist (Nukleotidposition 3346 in 
Fig. 4). Die Nukleotidsequenz urn diesen Haupttranskriptionsstart (TTA +I TTGT) 
30 reprasentiert daruberhinaus ein Initiator-Element (Inr), das in 6 von 7 Nukleotiden 
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mit dem Konsensusmotiv (PyPyA tl Na/tPyPy) (Smale, 1997) eines Initiator- 
Elementes ubereinstimmt. 

In unmittelbarer Nahe des experimentell identifizierten Haupt-Transkriptionsstartes 
5 konnte keine eindeutige TATA-Box identifiziert werden, so daB der hTC-Promoter 
wahrscheinlich in die Famiiie der TATA-losen Promotoren (Smale, 1997) einzu- 
ordnen ist. Allerdings wurde durch Bioinformatik Analyse eine potentielle TATA- 
Box von Nukleotidposition 1306 bis 1311 (Fig. 4) gefunden. Die zus&tziich urn den 
Haupt-Transkriptionsstart beobachteten Neben-Transkriptionsstarts wurden auch bei 
10 anderen TATA-losen Promotoren beschrieben (Geng and Johnson, 1993), vvie z.B. in 
den stark regulierten Promotoren einiger Zellzyklusgene (Wick et aL, 1995). 

Beispiel 7 

15 Zusatzlich zu dem in Beispiel 6 beschriebenen, in HL60 Zellen identifizierten 
Startpunkt des hTC Transkriptes, wurde ein weiterer Trans kriptionsstartbereich in 
HL60 Zellen identifiziert. Anhand von RT-PCR-Analysen wurde die Region des 
Transkriptionsstarts des hTC-Gens in HL60 Zellen auf die bp -60 bis -105 
eingegrenzt 

20 

Unter Einsatz von 0,4 ug Poly A-RNA aus HL60 Zellen (Clontech) und dem 
genspezifischen Primer GSP13 (5 ' -CCTCC A A AG AGGTGGCTTCTTCGGC-3 ' , 
cDNA-Position 920-897) wurde hierfUr die cDNA mit Hilfe des „First Strand cDNA- 
Synthesis Kit" (Clontech) nach Angaben der Hersteller synthetisiert. In einem 

25 Endvolumen von 50 ul wurden 1 ul cDNA mit 10 pmol dNTP-Mix versetzt und in 
lxPCR-Reaktionspuffer F (PCR-Optimizer Kit der Fa. InVitrogen) und einem Unit 
Platinum-Taq-DNA Polymerase (Fa. Gibco/BRL) eine PCR-Reaktion durchgefuhrt. 
Als Primer wurden jeweils 10 pmol der nachfolgend defmierten 5'- und 3'-Primer 
zugefugt. Die PCR wurde in 3 Schritten durchgefuhrt. An eine zweiminutige Dena- 

30 turierung bei 94°C schlossen sich 36 PCR-Zyklen an, in denen die DNA zunSchst fur 
45 sec bei 94°C denaturiert wurde und anschlieBend fiir 5 min bei 68°C die Primer 
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angelagert und die DNA-Kette verlSngert vvurde. Zum AbschluB folgte fur 1 0 min 
eine Kettenverlangerung bei 68°C. Insgesamt wurden sechs verschiedene 5 4 -PCR 
Primer (Primer HTRT5B: 5 l -CGCAGCCACTACCGCGAGGTGC-3\ cDNA- 
Position 105 bis 126; Primer C5S: 5 4 -CTGCGTCCTGCTGCGC ACGTGGG A AGC- 
5 3\ 5'-flankierende Region -49 bis -23; Primer PRO-TESTi: 5 l - 
CTCGCGGCGCGAGTTTCAGGCAG-3\ 5'-flankierende Region -74 bis -52; 
Primer PRO-TEST2: 5 ( -CCAGCCCCTCCCCTTCCTTTCC-3\ S'-flankierende 
Region -112 bis -91; Primer PRO-TEST4: 5 l -CCAGCTCCGCCTCCTCCGCGC-3\ 
5'-flankierende Region -191 - -171; Primer RP-3A: 5 l - 

10 CTAGGCCGATTCGACCTCTCTCC-3\ 5'-flankierende Region -427 bis -405) mit 
dem 3'-PCR Primer C5Rruck (S'-GTCCCAGGGCACGCACACCAGo 1 , cDNA- 
Position 245 bis 225) kombiniert. Als Kontrolle vvurde zusatzlich zu den Oligo-dT- 
und GSP13-geprimten cDNAs auch genomische DNA fur die PCR eingesetzt. Wie in 
Fig. 9 gezeigt, vvurde nur mit den Primerkombinationen HTRT5B-C5Rruck, C5S- 

1 5 C5Rriick und PRO-TEST 1 -C5 Rriick ein PCR-Produkt erhalten, was darauf hinweist, 
daB der Startpunkt der hTC-Transkription in der Region zwischen bp-60 und bp-105 
Hegt. 

Beispiel 8 

20 

In der ca. 11,2 kb isolierten S'-flankierenden Region des hTC-Gens befinden sich 
mehrere extrem GC-reiche Bereiche, sog. CpG Islands. Ein CpG Islands mit einem 
GC-Gehalt von > 70 % reicht von bp - 1214 bis in Intron 2. Zwei vveitere GC-reiche 
Bereiche mit einem GC-Gehalt von > 60 % reichen von bp —3872 bis bp —3 1 13 bzw. 
25 bp -5363 bis bp -3941. Die Lage der CpG Islands ist in der Fig. 11 graphisch 
dargestellt. 

Die Suche nach moglichen Transkriptionsfaktorbindungstellen vvurde mit dem „Find 
Pattern u -Aigorithmuses aus dem „GCG Sequenz Analysis" Programmpacket der 
30 „Genetics Computer Group" (Madison, USA) durchgefuhrt. Dadurch wurden 
verschiedene potentielle Bindungsstellen in der Region bis -900 bp upstream vom 
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Translations-Startcodon ATG indentifiziert: funf Spl-Bindungsstelien, eine c-Myc- 
Bindungsstelle, eine CCAC-Box (Fig. 10). Zus&tzlich wurden eine CCAAT-Box und 
eine zweite c-Myc-Bindungsstelle an den Positionen -1788 bzw. -3995 der 5 1 - 
flankierenden Region gefunden. 

5 

Beispiel 9 

Urn die Aktivitsit des hTC-Promotors zu analysieren, wurden durch PCR-Ampli- 
fikation vier verschieden lange hTC-Promotorsequenzabschnitte generiert und 5* vor 

10 das Reportergen Luziferase in den Vektor pGL2 der Fa. Promega kloniert. Als DNA- 
Quelle fur die PCR-Amplifikation wurde das aus dem Phagenklon PI 2 subklonierte, 
8,5 kb grofie Sacl-Fragment gewahlt. In einem Endvolumen von 50 ul wurden 35 ng 
dieser DNA mit 10 pmol dNTP-Mix versetzt und in IxPCR-Reaktionspuffer (PCR- 
Optimizer Kit der Fa. InVitrogen) und einem Unit Platinum-Taq-DNA Polymerase 

15 (Fa. Gibco/BRL) eine PCR-Reaktion durchgefiihrt. Als Primer wurden jeweils 
20 pmol der nachfolgend definierten 5'- und 3*-Primer zugefiigt. Die PCR wurde in 3 
Schritten durchgefiihrt. An eine zweiminiitige Denaturierung bei 94°C schlossen sich 
30 PCR-Zyklen an, in denen die DNA zunachst fiir 45 sec bei 94°C denaturiert 
wurde und anschlieitend fiir 5 min bei 68°C die Primer angelagert und die DNA- 

20 Kette verlangert wurde. Zum AbschluB foigte fiir 1 0 min eine Kettenverlangerung 
bei 68°C. Als 3 4 -PCR-Primer wurde jeweils der Primer PK-3A (5 l - 
GC A AGCTTG ACGC AGCGCTGCCTG A A ACTCG-3 4 , Position -43 bis -65) ge- 
wahlt, der einen Sequenzbereich 42 bp upstream vom START-Codon ATG erkennt. 
Durch Kombination des PK-3A-Primers mit dem S'-PCR-Primer PK-5B (5 4 - 

25 CCAGATCTCTGGAACACAGAGTGGCAGTTTCC-3 t , Position -4093 bis -4070) 
wurde ein 4051 bp groftes Promotor-Fragment amplifiziert (NPK8). Die 
Kombination des Primerpaares PK-3A und PK-5C (5 l - 
CC AGATCTGC ATGAAGTGTGTGGGG ATTTGC AG-3 1 , Position -3 1 20 bis- 
3096) fiihrte zur Amplifikation eines 3078 bp groBen Promotorfragmentes (NPK15). 

30 Ein 2068 bp grofies Promo torfragment wurde durch die Verwendung der Primer- 
kombination PK-3A und PK-5D (5'- 
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GG AG ATCTG ATCTTGGCTTACTGC AGCCTCTG-3 4 , Position -2110 bis -2087) 
amplifziert (NPK22). Der Einsatz der Primerkombination PK-3A und PK-5E (5'- 
GGAGATCTGTCTGGATTCCTGGGAAGTCCTCA-3\ Position -1125 bis -1102) 
fQhrte schlieBlich zur Amplifikation eines 1083 bp groBen Promotorfragmentes 
5 (NPK27). Der PK-3A Primer enthalt eine Hindlll Erkennungssequenz. Die 
verschiedenen 5 '-Primer enthalten eine Bglll-Erkennungssequenz. 

Die entstandenen PCR-Produkte wurden mit Hilfe des QIA quick spin PCR 
Purification Kits der Fa. Qiagen nach Angaben der Hersteller aufgereinigt und 

10 anschlieBend mit den Restriktionsenzymen Bglll und Hindlll verdaut. Mit den 
gleichen Restriktionsenzymen wurde der pGL2-Promotor-Vektor verdaut und der in 
diesem Vektor enthaltene SV40-Promotor freigesetzt und abgetrennt. Die PCR- 
Promotorfragmente wurden in den Vektor ligiert, in kompetente DH5a-Bakterien der 
Fa. Gibco/BRL transformiert. Aus trans formierten Bakterienklonen vvurde DNA fur 

15 die nachfolgend beschriebenen Promotor-Aktivitats-Analysen mit Hilfe des Qiagen 
Piasmid-Kits der Fa. Qiagen isoliert 

Bcispicl 10 

20 Die Aktivitat des hTC-Promotors wurde in transienten Transfektionen in 
eukaryotischen Zeilen analysiert. 

Alle Arbeiten mit eukaryotischen Zellen erfolgten an einem sterilen Arbeitspiatz. 
CHO-K1 und HEK 293 Zellen wurden von der American Type Culture collection 
25 bezogen. 

CHO-K1 Zellen wurden in DMEM Nut Mix F-12 Zellkulturmedium (Fa. Gibco- 
BRL, Bestellnummer: 21331-020) mit 0,15% Streptomycin/Penezillin, 2 mM 
Glutamin und 10 % FCS (Fa. Gibco-BRL) gehalten. 

30 
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HEK 293 Zellen wurden in DMOD Zellkulturmedium (Fa. Gibco-BRL, Bestell- 
nummer: 41965-039) mit 0,15 % Streptomycin/Pcnizillin, 2 mM Giutamin und 10 % 
FCS (Fa. Gibco-BRL) kultiviert. 

5 CHO-K1 und HEK 293 Zellen wurden in wasssergesattigter Atmosphare bei 37°C 
unter Begasung mit 5 % CO : kultiviert. Bei konfluentem Zellrasen wurde das 
Medium abgesaugt, die Zellen mit PBS (100 mM KH 2 P0 4 pH 7,2; 150 mM NaCl) 
gewaschen und durch Zugabe einer Trypsin-EDTA Losung (Fa. Gibco-BRL) 
abgelcist. Das Trypsin wurde durch Mediumzugabe inaktiviert und die Zellzahl mit 
10 einer Neubauer-Zahlkammer ermittelt, um die Zellen in gewunschter Dichte auszu- 
plattieren. 

FQr die Transfektion wurden pro Well jeweils 2x 10 3 -HEK 293 Zellen in einer 24- 
well Zelikulturplatte ausplattiert. Nach 3 Stunden wurde das HEK 293 Medium 

15 entfernt. Fur die Transfektion wurden bis zu 2,5 ug Plasmid-DNA, 1 ug eines CMV 
B-Gal Plasmidkonstruktes (Fa, Stratagene, Bestellnummer: 200388), 200 ul serum- 
freies Medium und 10 ul Transfektionsreagenz (DOTAP der Fa. Boehringer 
Mannheim) fur 15 Minuten bei Raumtemperatur inkubiert und anschlieBend auf die 
HEK 293 Zellen gleichmaflig aufgetropft. Nach 3 Stunden wurden 1,5 ml Medium 

20 hinzugegeben. Nach 20 Stunden wurde das Medium gewechseit. Nach weiteren 24 
Stunden wurden die Zellen zur Bestimmung der Luziferase- und der B-Gal-Aktivitat 
geerntet. Dazu wurden die Zellen im Zellkultur-Lysisreagenz (25 mM Tris [pH 7,8] 
mit H 3 P0 4 ; 2 mM CDTA; 2 mM DTT; 10% Glycerol; 1% Triton X-100) fur 15 
Minuten bei Raumtemperatur lysiert. Zwanzig ul dieses Zellysats wurden mit 100 ul 

25 Luziferase-Assaypuffer (20 mM Tricin; 1,07 mM (MgC0 3 ) 4 Mg(OH),"5H 2 0; 
2,67 mM MgS0 4 ; 0,1 mM EDTA; 33,3 mM DTT; 270 uM Coenzym A; 470 uM 
Luciferin, 530 uM ATP) gemischt und das durch die Luziferase generierte Licht 
gemessen. 

30 Zur Messung der B-Galaktosidaseaktivitat wurden gleiche Mengen Zellysat und B- 
Galaktosidase-Assaypuffer (100 mM Natriumphosphatpuffer pH 7,3; 1 mM MgCU; 
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50 mM fi-Merkaptoethanol; 0,665 mg/ml ONPG) fur mindestens 30 Minuten bei 
37°C oder bis eine leichte Gelbfarbung auftrat, inkubiert. Die Reaktion wurde durch 
Zugabe von 100 (il 1 M Na 2 C0 3 gestoppt und die Absorption bei 420 run bestimmt. 

5 Fur die Analyse des hTC-Promotors wurden vier verschieden lange hTC-Promotor- 
sequenzabschnitte 5' vor das Reportergen Luziferase kloniert (vergl. Beispiel 9). 

In der Fig. 11 sind die relativen Luziferase Aktivitaten zweier unabhangiger 
Transfektionen rnit den Konstrukten NPK8, NPK15, NPK22 und NPK27 in HEK 

10 293 Zellen aufgetragen. Jedes Experiment wurde in Duplikaten durchgefuhrt. 
Daruberhinaus wurde die Standardabweichung angegeben. Das Konstukt NPK 27 
zeigt eine 40fach hohere Luziferaseaktivitat als die Basalaktivitat des promotorlosen 
Luziferase-Kontrollkonstrutes (pGL2-basic) und eine 2 bis 3fach hohere Aktivitat als 
das SV40 Promotorkontroll-Konstrukt (pGL2PRO). Interessanterweise wurde im 

1 5 Vergieich zu dem Konstrukt NPK27 eine 2 bis 3fach geringere Luziferaseaktivitat in 
mit iangeren hTC Promotorkonstukten (NPK8, NPK.15, NPK22) transfizierten Zellen 
beobachtet. Ahnliche Ergebnisse wurden auch in CHO Zellen beobachtet (Daten 
nicht gezeigt). 
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Patentanspriiche 

1. Regulatorische DNA-Sequenzen fiir das Gen der humanen katalytischen 
Telomerase-Untereinheit. 

2. DNA-Sequenzen gemafl Anspruch 1, dadurch gekennzeichnet, daB es sich urn 
Intronsequenzen gemaB SEQ ID NO 4, 5,6, 7, 8,9, 10, II, 12, 13, 14, 15, 16, 
17, 18, 19 und/oder 20 oder um regulatorisch wirksame Fragmente dieser 
Sequenzen handelt. 

3. DNA-Sequenzen gemaB Anspruch 1, dadurch gekennzeichnet, daft es sich um 
die S'-flankierende regulatorische DNA-Sequenz fiir das Gen der humanen 
katalytischen Telomerase-Untereinheit gemaB Fig. 10 (SEQ ID NO 3) oder 
um regulatorisch wirksame Fragmente dieser DNA-Sequenz handelt. 

4. Rekombinantes Konstrukt, enthaltend eine DNA-Sequenz gemaB einem der 
Anspriiche 1 bis 3. 

5. Rekombinantes Konstrukt gemaB Anspruch 4, dadurch gekennzeichnet, daB 
es weiterhin eine oder mehrere DNA-Sequenzen enthalt, die fiir Polypeptide 
oder Proteine kodieren. 

6. Vektor, enthaltend ein rekombinantes Konstrukt gemaB Anspruch 4 oder 5. 

7. Verwendung von rekombinanten Konstrukten bzw. Vektoren gemaB einem 
der Anspriiche 4 bis 6 zur Herstellung von Arzneimitteln. 

8. Rekombinante Wirtszellen, enthaltend rekombinante Konstrukte bzw. Vek- 
toren gemaB einem der Anspriiche 4 bis 6. 
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9. Verfahren zur Identifizierung von Substanzen, die die Promotor-, Silencer- 
oder Enhanceraktivitat der humanen katalytischen Telomerase-Untereinheit 
beeinflussen, das folgende Schritte umfaBt: 

A. Zugabe einer Kandidatensubstanz zu einer Wirtszelle, enthaltend 
DNA-Sequenzen gemafi einem der Anspriiche 1 bis 3, funktionell 
verkniipft mit einem Reportergen, 

B. Messung des Substanzeffektes auf die Reportergenexpression. 

10. Verfahren zur Identifizierung von Faktoren, die spezifisch an die DNA gemaB 
einem der Anspriiche 1 bis 3 oder an Fragmente davon binden, dadurch 
gekennzeichnet, dafl man eine Expressions-cDNA-Bibliothek mit einer DNA- 
Sequenz gemaB einem der Anspriiche 1 bis 3 oder Teilfragmenten unter- 
schiedlichster Lange als Sonde screent. 

1 1 . Transgene Tiere, enthaltend rekombinante Konstrukte bzw. Vektoren gemaB 
Anspruchen 4 bis 6. 

12. Verfahren zur Detektion Telomerase-assoziierter Zustande bei einem 
Patienten, das folgende Schritte umfaBt: 

A. Inkubation eines rekombinanten Konstruktes bzw. Vektors gemaB 
Anspriichen 4 bis 6 das bzw. der zusatzlich ein Reportergen enthalt 
mit K6rperflussigkeiten oder zellularen Proben, 

B. Detektion der Reportergenaktivitat, um einen diagnostischen Wert zu 
erhalten, 
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C. Vergleich des diagnostischen Wertes mit Standard werten fur das 
Reportergenkonstrukt in standardisierten normalen Zellen oder 
KSrperflUssigkeiten des gleichen Typs wie die Testprobe. 

5 
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Fig. 4 

GAGCTCTGAA CCGTGGAAAC GAACATGACC CTTGCCTCCC TGCTTCCCTG GGTGGGTCAA GGGTAATGAA 70 
GTGGTGTGCA GGAAATGGCC ATGTAAATTA CACGACTCTG CTGATGGGGA CCGTTCCTTC CATCATTATT 140 
CATCTTCACC CCCAAGGACT GAATGATTCC AGCAACTTCT TCGGGTGTGA CAAGCCATGA CAAAACTCAG 210 
TACAAACACC ACTCTTTTAC TAGGCCCACA GAGCACGGGC CACACCCCTG ATAIATTAAG AGTCCAGGAG 280 
AGATGAGGCT GCTTTCAGCC ACCAGGCTGG GGTGACAACA GCGGCTGAAC AGTCTGTTCC TCTAGACTAG 350 
TAGACCCTGG CAGGCACTCC CCCAAATTCT AGGGCCTGGT TGCTGCTTCC CGAGGGCGCC ATCTGCCCTG 420 
GAGACTCAGC CTGGGGTGCC ACACTGAGGC CAGCCCTGTC TCCACACCCT CCGCCTCCAG GCCTCAGCTT 490 
CTCCAGCAGC TTCCTAAACC CTGGGTGGGC CGTGTTCCAG CGCTACTGTC TCACCTGTCC CACTGTGTCT 560 
TGTCTCAGCG ACGTAGCTCG CACGGTTCCT CCTCACATGG GGTGTCTGTC TCCTTCCCCA ACACTCACAT 630 
GCGTTGAAGG GAGGAGATTC TGCGCCTCCC AGACTGGCTC CTCTGAGCCT GAACCTGGCT CGTGGCCCCC 700 
GATGCAGGTT CCTGGCGTCC GGCTGCACGC TGACCTCCAT TTCCAGGCGC TCCCCGTCTC CTGTCATCTG 770 
CCGGGGCCTG CCGGTGTGTT CTTCTGTTTC TGTGCTCCTT TCCACGTCCA GCTGCGTGTG TCTCTGCCCG 840 
CTAGGGTCTC GGGGTTTTTA TAGGCATAGG ACGGGGGCGT GGTGGGCCAG GGCGCTCTTG GGAAATGCAA 910 
CATTTGGGTG TGAAAGTAGG AGTGCCTGTC CTCACCTAGG TCCACGGGCA CAGGCCTGGG GATGGAGCCC 980 
CCGCCAGGGA CCCGCCCTTC TCTGCCCAGC ACTTTCCTGC CCCCCTCCCT CTGGAACACA GAGTGGCAGT 1050 
TTCCACAAGC ACTAAGCATC CTCTTCCCAA AAGACCCAGC ATTGGCACCC CTGGACATTT GCCCCACAGC 1120 
CCTGGGAATT CACGTGACTA CGCACATCAT GTACACACTC CCGTCCACGA CCGACCCCCG CTGTTTTATT 1190 
TTAATAGCTA CAAAGCAGGG AAATCCCTGC TAAAATGTCC TTTAACAAAC TGGTTAAACA AACGGGTCCA 1260 
TCCGCACGGT GGACAGTTCC TCACAGTGAA GAGGAACATG CCGTTTATAA AGCCTGCAGG CATCTCAAGG 1330 
GAATTACCCT GAGTCAAAAC TGCCACCTCC ATGGGATACG TACGCAACAT GCTCAAAAAG AAAGAATTTC 1400 
ACCCCATGGC AGGGGAGTGG TTAGGGGGGT TAAGGACGGT GGGGGCGGCA GCTGGGGGCT ACTGCACGCA 1470 
CCTTTTACTA AAGCCAGTTT CCTGGTTCTG ATGGTATTGG CTCAGTTATG GGAGACTAAC CATAGGGGAG 1540 
TGGGGATGGG GGAACCCGGA GGCTGTGCCA TCTTTGCCAT GCCCGAGTGT CCTGGGCAGG ATAATGCTCT 1610 
AGAGATGCCC ACGTCCTGAT TCCCCCAAAC CTCTGGACAG AACCCGCCCG GCCCCAGGGC C TTT GC ACGT 1680 
GTGATCTCCG TGAGGACCCT GAGGTCTGGG ATCCTTCGGG ACTACCTGCA GGCCCGAAAA GTAATCCAGG 1750 
GGTTCTGGGA AGAGGCGGGC AGGAGGGTCA GAGGGGGGCA GCCTCAGGAC GATGGAGGCA GTCAGTCTGA 1820 
GGCTGAAAAG GGAGGGAGGG CCTCGAGCCC AGGCCTGCAA GCGCCTCCAG AAGCTGGAAA AAGCGGGGAA 1890 
GGGACCCTCC ACGGAGCCTG CAGCAGGAAG GCACGGCTGG CCCTTAGCCC ACCAGGGCCC ATCGTGGACC 1960 
TCCGGCCTCC GTGCCATAGG AGGGCACTCG CGCTGCCCTT CTAGCATGAA GTGTGTGGGG ATTTGCAGAA 2030 
GCAACAGGAA ACCCATGCAC TGTGAATCTA GGATTATTTC AAAACAAAGG TTTACAGAAA CATCCAAGGA 2100 
CAGGCCTGAA GTGCCTCCGG GCAAGGGCAG GGCAGGCACG AGTGATTTTA TTTAGCTATT TXATTTTATT 2170 
TACTTACTTT CTGAGACAGA GTTATGCTCT TGTTGCCCAG GCTGGAGTGC AGCGGCATGA TCTTGGCTCA 2240 
CTGCAACCTC CCTCTCCTGG GTTCAAGCAA TTCTCGTGCC TCAGCCTCCC AAGTAGCTGG GATTTCAGGC 2310 
GTGCACCACC ACACCCGGCT AATTTTGTAT TTTTAGTAGA GATGGGCTTT CACCATGTTG GTCAAGCTGA 2380 
TCTCAAAATC CTGACCTGAG GTGATCCCCC CACCTCAGCC TCCCAAAGTG CTGGGATTAC AGGCATGAGC 2450 
CACTGCACCT GGCCTATTTA ACCATTTTAA AACTTCCCTG GGCTCAAGTC ACACCCACTG GTAAGGAGTT 2520 
CATGGAGTTC AATTTCCCCT TTACTCAGGA GTTACCCTCC TTTGATATTT TCTCTAATTC TTCGTAGACT 2590 
GGGGATACAC CGTCTCTTGA CATATTCACA GTTTCTGTGA CCACCTGTTA TCCCAXGCGA CCCACTGCAG 2660 
GGGCAGCTGG GAGGCTGCAG GCTTCAGGTC CCAGTGGGGT TGCCATCTGC CAGTAGAAAC CTGATGTAGA 2730 
ATCAGGGCGC AAGTGTGGAC ACTGTCCTGA ATCTCAATGT CTCAGTGTGT GCTGAAACAT GTAGAAATTA 2800 
AAGTCCATCC CTCCTACTCT ACTGGGATTG AGCCCCTTCC CTATCCCCCC CCAGGGGCAG AGGAGTTCCT 2870 
CTCACTCCTG TGGAGGAAGG AATGATACTT TGTTATTTTT CACTGCTGGT ACTGAATCCA CTGTTTCATT 2940 
TGTTGGTTTG TTTGTTTTGT TTTGAGAGGC GGTTTCACTC TTGTTGCTCA GGCTGGAGGC AGTGCAATGG 3010 
CGCGATCTTG GCTTACTGCA GCCTCTGCCT CCCAGGTTCA AGTGATTCTC CTGCTTCCGC CTCCCAXTTG 3080 
GCTGGGATTA CAGGCACCCG CCACCATGCC CAGCTAATTT TTTGTATTTT TAGTAGAGAC GGGGGTCGGT 3150 
GGGGTTCACC ATGTTGGCCA GGCTGGTCTC GAACTTCTGA CCTCAGATGA TCCACCTGCC TCTGCCTCCT 3220 
AAAGTGCTGG GATTACAGGT GTGAGCCACC ATGCCCAGCT CAGAATTTAC TCTCTTTAGA AACATCTGGG 3290 
TCTGAGGTAG GAACCT CACC CCACTCAAGT GTTGTGGTGT TTTAAGCCAA TGAXAGAAXT TTTTTATTGT 3360 
TGTTAGAACA CTCTTGATGT TTTACACTGT GATGACTAAG ACATCATCAG CTTTTCAAAG ACACACTAAC 3430 
TGCACCCATA ATACTGGGGT GTCTTCTGGG TATCAGCAAT CTTCATTGAA TGCCGGGAGG CGTTTCCTCG 3500 
CC ATCCACA T GGTGTTAATT ACTCCAGCAT AATCTTCTGC TTCCATTTCT TCTCTTU C Cr CTTTTAAAAT 3570 
TGTGTTTTCT ATCTTGGCTT CTCTGCAGAG AACCAGTGTA AGCTACAACT TAACTTTTGT TGGAACAAAT 3640 
TTTCCAAACC GCCCCTTTGC CCTAGTGGCA GAGACAATTC ACAAACACAG CCCTTTAAAA AGGCTTAGGG 3710 
ATCACTAAGG GGATTTCTAG AAGAGCGACC TGTAATCCTA AGTATTTACA AGACGAGGCT AACCTCCAGC 3780 
GAGC GTGftC A CCCCAGGCAG GGTGCGAGGC CTGTTCAAAT GCTAGCTCCA TAAATAAAGC AATTTCCTCC 3850 
GGCAGTTTCT GAAAGTAGGA AAGGTTACAT TTAAGGTTGC GTTTGTTAGC ATTTCAGTGT TTGCCGACCT 3920 
CAGCTACAGC ATCCCTGCAA GGCCTCGGGA GACCCAGAAG TTTCTCGCCC CCTTAGATCC AAACTTGAGC 3990 
AACCCGGAGT CTGGATTCCT GGGAAGTCCT CAGCTGTCCT GCGGTTGTGC CGGGGCCCCA GGTCTGGAGG 4060 
GGACCAGTGG CCGTGTGGCT TCTACTGCTG GGCTGGAAGT CGGGCCTCCT AGCTCTGCAG TCCGAGGCTT 4X30 
GGAGCCAGGT GCCTGGACCC CGAGGCTGCC CTCCACCCTG TGCGGGCGGG ATGTGACCAG ATGTTGGCCT 4200 
CATCTGCCAG ACAGAGTGCC GGGGCCCAGG GTCAAGGCCG TTGTGGCTGG TGTGAGGCGC CCGGTGCGCG 4270 
GCCAGCAGGA GCGCCTGGCT CCATTTCCCA CCCTTTCTCG ACGGGACCGC CCCGGTGGGT GATTAACAGA 4340 
TTTGGGGTGG TTTGCTCATG GXGGGGACCC CTCGCCGCCT GAGAACCTGC AAAGAGAAAT GACCGGCCTG 4410 
TGTCAAGGAG CCCAAGTCCC GGGGAAGTGT TGCAGGGAGG CACTCCGGGA GGTCCCGCGT GCCCGTCCAG 4480 
GGAGCAATCC GTCCTCGGCT TCGTCCCCAG CCGCGTCTAC GCGCCTCCGT CCTCCCCTTC ACGTCCGGCA 4550 
TTCGTGGTGC CCGGAGCCCG ACGCCCCGCG TCCGGACCTG GACGCAGCCC TGGGTCTCCG GATCAGGCCA 4620 
GCGGCCAAAG GGTCGCCGCA CGCACCTCTT CCCAGGGCCT CCAGATCATG CCCCCTCCCT CGGGTTACCC 4690 
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CACAGCCTAG GCCGATTCGA CCTCTCTCCG CTGGGGCCCT CGCTGGCGTC CCTCCACCCT GGGAGCGCGA 4760 

GCGGCGCGCG GGCGGGGAAG CGCGGCCCAG ACCCCCGGGT CCGCCCGGAG CAGCTGCGCT GTCGGGGCCA 4830 

GGCCGGGCTC CCAGTGGATT CGCGGGCACA GACGCCCAGG ACCGCGCTCC CCACGTCGCG GAGGGACTGG 4900 

GGACCCGGGC ACCCGTCCTG CCCCTTCACC TTCCAGCTCC GCCTCCTCCG CGCGGACCCC GCCCCGTCCC 4970 

GACCCCTCCC GGGTCCCCGG CCCAGCCCCC TCCGGGCCCT CCCAGCCCCT CCCCTTCCTT TCCGCGGCCC 5040 

CGCCCTCTCC TCGCGGCGCG AGTTTCAGGC AGCGCTGCGT CCTGCTGCGC ACGTGGGAAG CCCTGGCCCC 5110 

GGCCACCCCC GCGATG 5126 
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Fig. 6 

GTTTCAGGCA GCGCTGCGTC CTGCTGCGCA CGTGGGAAGC CCTGCCCCCC CCCACCCCCG CGATGCCGCG 70 
CGCTCCCCGC TGCCGAGCCG TGCGCTCCCT GCTCCGCAGC CACTACCGCG AGCTGCTGCC GCTGGCCACG 140 
TTCGTGCGGC GCCTGGGGCC CCAGGGCTGG CGGCTGGTGC AGCGCGGGGA CCCGGCGGCT TTCCGCGCGC 210 
TGGTGGCCCA GTGCCTGGTG TGCGTGCCCT GGGACGCACG GCCGCCCCCC GCCGCCCCCT CCTTCCGCCA 280 
GGTGTCCTGC CTGAAGGAGC TGGTGGCCCG AGTGCTGCAG AGGCTGTGCG AGCGCGGCGC GAAGAACGTG 350 
CTGGCCTTCG GCTTCGCGCT GCTGGACGGG GCCCGCGGGG GCCCCCCCGA GGCCTTCACC ACCACCGTGC 420 
GCAGCTACCT GCCCAACACG GTGACCGACG CACTGCGGGG GAGCGGGGCG TGGGGGCTGC TGCTGCGCCG 490 
CGTGGGCGAC GACGTGCTGG TTCACCTGCT GGCACGCTGC GCCCTCTTTG TGCTGGTGGC TCCCAGCTGC 560 
GCCTACCAGG TGTGCGGGCC GCCGCTGTAC CAGCTCGGCG CTGCCACTCA GGCCCGGCCC CCGCCACACG 630 
CTAGTGGACC CCGAAGGCGT CTGGGATGCG AACGGGCCTG GAACCATAGC GTCAGGGAGG CCGGGGTCCC 700 
CCTGGGCCTG CCAGCCCCGG GTGCGAGGAG GCGCGGGGGC AGTGCCAGCC GAAGTCTGCC GTTGCCCAAG 770 
AGGCCCAGGC GTGGCGCTGC CCCTGAGCCG GAGCGGACGC CCGTTGGGCA GGGGTCCTGG GCCCACCCGG 840 
GCAGGACGCG TGGACCGAGT GACCGTGGTT TCTGTGTGGT GTCACCTGCC ACACCCGCCG AAGAAGCCAC 910 
CTCTTTGGAG GGTGCGCTCT CTGGCACGCG CCACTCCCAC CCATCCGTGG GCCGCCAGCA CCACGCGGGC 980 
CCCCCATCCA CATCGCGGCC ACCACGTCCC TCGGACACGC CTTGTCCCCC GGTGTACGCC GAGACCAAGC 1050 
ACTTCCTCTA CTCCTCAGGC GACAAGGAGC AGCTGCGGCC CTCCTTCCTA CTCAGCTCTC TGAGGCCCAG 1120 
CCTGACTGGC GCTCGGAGGC TCGTGGAGAC CATCTTTCTG GGTTCCAGGC CCTGGATGCC AGGGACTCCC 1190 
CGCAGGTTGC CCCGCCTGCC CCAGCGCTAC TGGCAAATGC GGCCCCTGTT TCTGGAGCTG CTTGGGAACC 1260 
ACGCGCAGTG CCCCTACGGG GTGCTCCTCA AGACGCACTG CCCGCTGCGA GCTGCGGTCA CCCCAGCAGC 1330 
CGGTGTCTGT GCCCGG&AGA AGCCCCAGGG CTCTGTGGCG GCCCCCGAGG AGGAGGACAC AGACCCCCGT 1400 
CGCCTGGTGC AGCTGCTCCG CCAGCACAGC AGCCCCTGGC AGGTGTACGG CTTCGTGCGG GCCTGCCTGC 1470 
GCCGGCTGGT GCCCCCAGGC CTCTGGGGCT CCAGGCACAA CGAACGCCGC TTCCTCAGGA ACACCAAGAA 1540 
GTTCATCTCC CTGGGGAAGC ATGCCAAGCT CTCGCTGCAG GAGCTGACGT GGAAGATGAG CGTGCGGGAC 1610 
TGCGCTTGGC TGCGCAGGAG CCCAGGGGTT GGCTGTGTTC CGGCCGCAGA GCACCGTCTG CGTCAGGAGA 1680 
TCCTGGCCAA GTTCCTGCAC TGGCTGATGA GTGTGTACGT CGTCGAGCTG CTCAGGTCTT TCTTTTATGT 1750 
CACGGAGACC ACGTTTCAAA AGAACAGGCT CTTTTTCTAC CGGAAGAGTG TCTGGAGCAA GTTGCAAAGC 1820 
ATTGGAATCA GACAGCACTT GAAGAGGGTG CAGCTGCGGG AGCTGTCGGA ACCAGAGCTC ACGCAGCATC 1890 
GGGAACCCAG GCCCGCCCTG CTGACGTCCA GACTCCGCTT CATCCCCAAG CCTGACGGGC TGCCCCCGAI 1960 
TGTGAACATG GACTACGTCG TGGGAGCCAG AACGTTCCGC AGAGAAAAGA GGGCCGAGCG TCTCACCTCG 2030 
AGGGTGAAGG CACTGTTCAG CGTGCTCAAC TACGAGCGGG CGCGGCGCCC CGGCCTCCTG GGCGCCTCTG 2100 
TGC7GGGCCT GGACGATATC CACAGGGCCT GGCGCACCTT CGTGCTGCGT GTGCGGGCCC AGGACCCGCC 2170 
GCCTGAGCTG XACTTTGTCA AGGTGGATGT GACGGGCGCG TACGACACCA TCCCCCACGA CAGGCTCACG 2240 
GAGGTCATCG CCAGCATCAT CAAACCCCAG AACACGTACT GCGTGCGTCG GTATGCCGTG GTCCAGAAGG 2310 
CCGCCCATGG GCACGTCCGC AAGGCCTTCA AGAGCCACGT CTCTACCTTG ACAGACCTCC AGCCGTACAT 2380 
GCGACAGTTC GTGGCTCACC TGCAGGAGAC CAGCCCGCTG AGGGATGCCG TCGTCATCGA GCAGACCTCC 2450 
TCCCTGAATG AGGCCAGCAG TGGCCTCTTC GAC G T C TTCC TACGCTTCAT GTGCCACCAC GCCGTGCGCA 2520 
TCAGGGGCAA GTCCTACGTC CAGTGCCAGG GGATCCCGCA GGGCTCCATC CTCTCCACGC TGCTCTGCAG 2590 
CCTGTGCTAC GGCGACATGG AGAACAAGCT GTTTGCGGGG ATTCGGCCGG ACGGGCTGCT CCTGCGTTTG 2660 
GTGGATGATT TCTTGTTGGT GACACCTCAC CTCACCCACG CGAAAACCTT CCTCAGGACC CTGGTCCGAG 2730 
GTGTCCCTGA GTATGGCTGC GTGGTGAACT TGCGGAAOAC AGTGGTGAAC TTCCCTGTAG AAGACGAGGC 2800 
CCTGGGTGGC ACGGCTTTTG TTCAGATGCC GGCCCACGGC CTATTCCCCT GGTGCGGCCT GCTGCTGGAT 2870 
ACCCGGACCC TGGAGGTGCA GAGCGACTAC TCCAGCTATG CCCGGACCTC CATCAGAGCC A G T C TC A CCT 2940 
TCAACCGCGG CTTCAAGGCT GGGAGGAACA TGCGTCGCAA ACTCTTTGGG GTCTTGCGGC TGAA G TGTCA 3010 
CAGCCTGTTT CTGGATTTGC AGGTGAACAG CC7CCAGACG GTGTGCACCA ACATCTACAA GATCCTCCTG 3080 
CTGCAGGCGT ACAGCTTTCA CGCATGTGTG CTCCAGCTCC CATTTCATCA GCAAGTTTGG AAGAACCCCA 3150 
CATTTTTCCT GCGCGTCATC TCTGACACGG CCTCCCTCTG CTACTCCATC CTGAAAGCCA AGAACGCAGG 3220 
GATCTCGCTG GGGGCCAAGG GCGCCGCCGG CCCTCTGCCC TCCGAGGCCG TGCAGTGGCT GTGCGACCAA 3290 
GCATTCCTGC TCAACCTGAC TCGACACCGT GTCACCTACG TGCCACTCCT GGGGTCACTC AGGACAGCCC 3360 
AGACGCAGCT GAGTCGGAAG CTCCCGGGGA CGACGCTGAC TGCCCTGGAG GCCGCACCCA ACCCGGCACT 3430 
GCCCTCAGAC TTCAAGACCA TCCTGGACTG ATGGCCACCC GCCCACAGCC ACGCCGAGAG CAGACACCAG 3500 
CAGCCCTCTC ACGCCGGGCT CXACGTCCCA GGGAGGGACG GGCGGCCCAC ACCCAGGCCC GCACCGCTGG 3570 
GAGTCTGAGG CCTGAGTGAC TGTTTGGCCG AGGCCTGCAT GTCCGGCTGA AGGCTGAGTG TCCGGCTGAG 3640 
GCCTGAGCGA GTGTCCAGCC AAGGGCTGAC TGTCCAGCAC ACCTGCCGTC TTCACTTCCC CACACGCTGG 3710 
CGCTCGGCTC CACCCCAGGG CCAGCTTTTC CTCACCAGGA GCCCGGCTTC CACTCCCCAC ATAGGAATAG 3780 
TCCATCCCCA GATTCGCCAT TGTTCACCCC TCGCCCTGCC CTCCTTTGCC TTCCACCCCC ACCATCCAGG 3850 
TGGAGACCCT GAGAAGGACC CTGGGAGCTC TGGGAATTTG GAGTGACCAA AGGTGTGCCC TGTACACAGG 3920 
CGAGGACCCT GCACCTGGAT GGGGGTCCCT GTGGGTCAAA TTGGGGGGAG GTCCTCTGGG AGTAAAATAC 3990 
TGAATATATG AGTTTTTCAG TTTTGAAAAA AAAAAAAAAA AAAAAAAAAA AA 4042 
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Fig. 10 

ACTTGAGCCC. AAGAGTTCAA GGCTACGGTG AGCCATGATT GCAACACCAC ACGCCAGCCT TGGTGACAGA -11204 
ATGAGACCCT GTCTCAAAAA AAAAAAAAAA AATTGAAATA ATATAAAGCA TCTTCTCTGG CCACAGTGGA -11134 
ACAAAACCAG AAATCAACAA CAAGAGGAAT TTTGAAAACT ATACAAACAC ATGAAAATTA AACAATATAC -11064 
TTCTGAATGA CCAGTGAGTC AATGAAGAAA ' TT AAAAAGG A AATTGAAAAA TTTATTTAAG CAAATGATAA -10994 
CGGAAACATA ACCTCTCAAA ACCCACGGTA TACAGCAAAA GCAGTGCTAA GAAGGAAGTT TATAGCTATA -10924 
AGCAGCTACA TCAAAAAAGT AGAAAAGCCA GGCGCAGTGG CTCATGCCTG TAATCCCAGC ACTTTGGGAG -10854 
GCCAAGGCGG GCAGATCGCC ■ TGAGGTCAGG AGTTCGAGAC CAGCCTGACC AACACAGAGA AACCTTGTCG -10784 
CTACTAAAAA TACAAAATTA GCTGGGCATG GTGGCACATG CCTGTAATCC CAGCTACTCG GGAGGCTGAG -10714 
GCAGGATAAC CGCTTGAACC CAGGAGGTGG AGGTTGCGGT GAGCCGGGAT TGCGCCATTG GACTCCAGCC -1064 4 
TGGGTAACAA GAGTGAAACC CTGTCTCAAG AAAAAAAAAA AAGTAGAAAA ACTTAAAAAT ACAACCTAAT -1057 4 
GATGCACCTT AAAGAACTAG AAAAGCAAGA GCAAACTAAA CCTAAAATTG GTAAAAGAAA AGAAATAATA -10504 
AAGATCAGAG CAGAAATAAA TGAAACTGAA AGATAACAAT ACAAAAGATC AACAAAATTA AAAGTTGGTT -10434 
TTTTGAAAAG ATAAACAAAA TTGACAAACC TTTGCCCAGA CTAAGAAAAA AGGAAAGAAG ACCTAAATAA -10364 
ATAAAGTCAG AGATGAAAAA AGAGACATTA CAACTGATAC CACAGAAATT CAAAGGATCA CTAGAGGCTA -10294 
CTATGAGCAA CTGTACACTA ATAAATTGAA AAACCTAGAA AAAATAGATA AATTCCTAGA TGCATACAAC -10224 
CTACCAAGAT TGAACCATGA AGAAATCCAA AGCCCAAACA GACCAATAAC AATAATGGGA TTAAAGCCAT -10154 
AATAAAAAGT CTCCTAGCAA AGAGAAGCCC AGGACCCAAT GGCTTCCCTG CTGGATTTTA CCAATCATTT -10084 
AAAGAAGAAT GAATTCCAAT CCTACTCAAA CTATTCTGAA AAATAGAGGA AAGAATACTT CCAAACTCAT -10014 
TCTACATGGC CAGTATTACC CTGATTCCAA AACCAGACAA AAACACATCA AAAACAAACA AACAAAAAAA -9944 
CAGAAAGAAA GAAAACTACA GGCCAATATC CCTGATGAAT ACT GAT AC AA AAATCCTCAA CAAAACACTA -9874 
GCAAACCAAA TTAAACAACA CCTTCGAAAG ATCATTCATT GTGATCAAGT GGGATTTATT CCAGGGATGG -9804 
AAGGATGGTT CAACATATGC AAATCAATCA ATGTGATACA TCATCCCAAC AAAATGAAGT ACAAAAACTA -9734 
TATGATTATT TCACTTTATG CAGAAAAAGC ATTTGATAAA ATTCTGCACC CTTCATGATA AAAACCCTCA -9664 
AAAAACCAGG TATACAAGAA ACATACAGGC CAGGCACAGT GGCTCACACC TGCGATCCCA GCACTCTGGG -9594 
AGGCCAAGGT GGGATGATTG CTTGGGCCCA GGAGTTTGAG ACTAGCCTGG GCAACAAAAT GAGACCTGGT -9524 
CTACAAAAAA CTTTTTTAAA AAATTAGCCA GGCATGATGG CATATGCCTG TAGTCCCAGC TAGTCTGGAG -9454 
GCTGAGGTGG GAGAATCACT TAAGCCTAGG AGGTCGAGGC TGCAGTGAGC CATGAACATG TCACTGTACT -9384 
CCAGCCTAGA CAACAGAACA AGACCCCACT GAATAAGAAG AAGGAGAAGG AGAAGGGAGA AGGGAGGGAG -9314 
AAGGGAGGAG GAGGAGAAGG AGGAGGTGGA GGAGAAGTGG AAGGGGAAGG GGAAGGGAAA GAGGAAGAAG -9244 
AAGAAACATA TTTCAACATA ATAAAAGCCC TATATGACAG ACCGAGGTAG TATTATGAGG AAAAACTGAA -9174 
AGCCTTTCCT CTAAGATCTG GAAAATGACA AGGGCCCACT TTCACCACTG TGATTCAACA TAGTACTAGA -9104 
AGTCCTAGCT AGAGCAATCA GATAAGAGAA AGAAATAAAA GGCATCCAAA CTGGAAAGGA AGAAGTCAAA -9034 
TTATCCTGTT TGCAGATGAT ATGATCTTAT ATCTGGAAAA GACTTAAGAC ACCACTAAAA AACTATTAGA -8964 
GCTGAAATTT GGTACAGCAG GATACAAAAT CAATGTACAA AAATCAGTAG TATTTCTATA TTCCAACAGC -8894 
AAACAATCTG AAAAAGAAAC CAAAAAAGCA GCTACAAATA AAATTAAACA GCTAGGAATT AACCAAAGAA -8824 
GTGAAAGATC TCTACAATGA AAACTATAAA ATGTTGATAA AAGAAATTGA AGAGGGCACA AAAAAAGAAA -8754 
AGATATTCCA TGTTCATAGA TTGGAAGAAT AAATACTGTT AAAATGTCCA f ACTACCCAA AGCAATTTAC -8684 
AAATTCAATG CAATCCCTAT TAAAATACTA ATGACGTTCT TCACAGAAAT AGAAGAAACA ATTCTAAGAT -8614 
TTGTACAGAA CCACAAAAGA CCCAGAATAG CCAAAGCTAT CCTGACCAAA AAGAACAAAA CTGGAAGCAT -8544 
CACATTACCT GACTTCAAAT TATACTACAA AGCTATAGTA ACCCAAACTA CATGGTACTG GCATAAAAAC -847 4 
AGATGAGACA TGGACCAGAG GAACAGAATA GAGAATCCAG AAACAAATCC ATGCATCTAC AGTGAACTCA -8404 
TTTTTGACAA AGGTGCCAAG AACATACTTT GGGGAAAAGA TAATCTCTTC AATAAATGGT GCTGGAGGAA -8334 
CTGGATATCC ATATGCAAAA TAACAATACT AGAACTCTGT CTCTCACCAT ATACAAAAGC AAATCAAAAT -8264 
GGATGAAAGG CTTAAATCTA AAACCTCAAA CTTTGCAACT ACTAAAAGAA AACACCGGAG AAACTCTCCA -8194 
GGACATTGGA GTGGGCAAAG ACTTCTTGAG TAATTCCCTG CAGGCACAGG CAACCAAAGC AAAAACAGAC -8124 
AAATGGGATC ATATCAAGTT AAAAAGCTTC TGCCCAGCAA AGGAAACAAT CAACAAAGAG AAGAGACAAC -8054 
CCACAGAATG GGAGAATATA TTTGCAAACT ATTCATCTAA CAAGGAATTA ATAACCAGTA TATATAAGGA -7984 
GCTCAAACTA CTCTATAAGA AAAACACCTA ATAAGCTGAT TTTCAAAAAT AAGCAAAAGA TCTGGGTAGA -7914 
CATTTCTCAA AATAAGTCAT ACAAATGGCA AACAGGCATC TGAAAATGTG CTCAACACCA CTGATCATCA -7844 
GAGAAATGCA AATCAAAACT ACTATGAGAG ATCATCTCAT CCCAGTTAAA ATGG CTTT TA TTCAAAAGAC -7774 
AGGCAATAAC AAATGCCAGT GAGGATGTGG ATAAAAGGAA ACCCTTGGAC ACTGTTGGTG GGAATGGAAA -7704 
TTGCTACCAC TATGGAGAAC AGTTTGAAAG TTCCTCAAAA AACTAAAAAT AAAGCTACCA TACAGCAATC -7634 
CCATTGCTAG GTATATACTC CAAAAAAGGG AATCAGTGTA TCAACAAGCT ATCTCCACTC CCACATTTAC -7564 
TGCAGCACTG TTCATAGCAG CCAAGGTTTG GAAGCAACCT CAGTGTCCAT CAACAGACGA ATGGAAAAAG -7494 
AAAATGTGGT GCACATACAC AATGGAGTAC TACGCAGCCA TAAAAAAGAA TGAGATCCTG TCAGTTGCAA -7424 
CAGCATGGGG GGCACTGGTC AGTATGTTAA GTGAAATAAG CCAGGCACAG AAAGACAAAC TTTTCATGTT -7354 
CTCCCTTACT TGTGGGAGCA AAAATTAAAA CAATTGACAT AGAAATAGAG GAGAATGGTG GTTCTAGAGG -7284 
GGTGGGGGAC AGGGTGACTA GAGTCAACAA TAATTTATTG TATGTTTTAA AATAACTAAA AGAGTATAAT -7214 
TGGGTTGTTT GTAACACAAA GAAAGGATAA ATGCTTGAAG GTGACAGATA CCCCATTTAC CCTGATGTGA -714 4 
TTATTACACA TTGTATGCCT GTATCAAAAT ATCTCATGTA TGCTATAGAT ATAAACCCTA CTATATTAAA -7074 
AATTAAAATT TTAATGGCCA GGCACGGTGG CTCATGTCCG TAATCCCAGC ACTTTGGGAG GCCGAGGCGG -7004 
GTGGATCACC TGAGGTCAGG AGTTTGAAAC CAGTCTGGCC ACCATGATGA AACCCTGTCT CTACTAAAGA -6934 
TACAAAAATT AGCCAGGCGT GGTGGCACAT ACCTGTAGTC CCAACTACTC AGGAGGCTGA GACAGGAGAA -6864 
TTGCTTGAAC CTGGGAGGCG GAGGTTGCAG TGAGCCGAGA TCATGCCACT GCACTGCAGC CTGGGTGACA -67 94 
GAGCAAGACT CCATCTCAAA ACAAAAACAA AAAAAAGAAG ATTAAAATTG TAATTTTTAT GTACCGTATA -6724 
AATATATACT CTACTATATT AGAAGTTAAA AATTAAAACA ATTATAAAAG GTAATTAACC ACTTAATCTA -6654 
AAATAAGAAC AATGTATGTG GGGTTTCTAG CTTCTGAAGA AGTAAAAGTT ATGGCCACGA TGGCAGAAAT -6584 
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GTGAGGAGGG AACAGTGGAA GTTACTGTTG TTAGACGCTC ATACTCTCTG TAAGTGACTT AATTTTAACC -6514 
AAAGACAGGC TGGGAGAAGT TAAAGAGGCA TTCTATAAGC CCTAAAACAA CTGCTAATAA TGGTGAAAGG -6444 
TAATCTCTAT TAATTACCAA TAATTACAGA TATCTCTAAA ATCGAGCTGC AGAATTGGCA CGTCTGATCA -6374 
CACCGTCCTC TCATTCACGG TGCTTTTTTT CTTGTGTGCT TGGAGATTTT CGATTGTGTG TTCGTGTTTG -6304 
GTTAAACTTA ATCTGTATGA ATCCTGAAAC GAAAAATGGT GGTGATTTCC TCCAGAAGAA TTAGAGTACC -6234 
TGGCAGGAAG CAGGTGGCTC TGTGGACCTG AGCCACTTCA ATCTTCAAGG GTCTCTGGCC AAGACCCAGG -6164 
TGCAAGGCAG AGGCCTGATG ACCCGAGGAC AGGAAAGCTC GG AT GGGAAG GGGCGATGAG AAGCCTGCCT -6094 
CGTTGGTGAG CAGCGCATGA AGTGCCCTTA TTTACGCTTT GCAAAGATTG CTCTGGATAC CATCTGGAAA -6024 
AGGCGGCCAG CGGGAATGCA AGGAGTCAGA AGCCTCCTGC TCAAACCCAG GCCAGCAGCT ATGGCGCCCA -5954 
CCCGGGCGTG TGCCAGAGGG AGAGGAGTCA AGGCACCTCG AAGTATGGCT TAAATCTTTT TTTCACCTGA -5884 
AGCAGTGACC AAGGTGTATT CTGAGGGAAG CTTGAGTTAG GTGCCTTCTT TAAAACAGAA AGTCATGGAA -5814 
GCACCCTTCT CAAGGGAAAA CCAGACGCCC GCTCTGCGGT CATTTACCTC TTTCCTCTCT CCCTCTCTTG -5744 
CCCTCGCGGT TTCTGATCGG GACAGAGTGA CCCCCGTGGA GCTTCTCCGA GCCCGTGCTG AGGACCCTCT -5674 
TGCAAAGGGC TCCACAGACC CCCGCCCTGG AGAGAGGAGT CTGAGCCTGG CTTAATAACA AACTGGGATG -5604 
TGGCTGGGGG CGGACAGCGA CGGCGGGATT CAAAGACTTA AT TC CAT GAG TAAATTCAAC CTTTCCACAT -5534 
CCGAATGGAT TTGGATTTTA TCTTAATATT TTCTTAAATT TCATCAAATA ACATTCAGGA CTGCAGAAAT -5464 
CCAAAGGCGT AAAACAGGAA CTGAGCTATG TTTGCCAAGG TCCAAGGACT TAATAACCAT GTTCAGAGGG -5394 
ATTTTTCGCC CTAAGTACTT TTTATTGGTT TTCATAAGGT GGCTTAGGGT GCAAGGGAAA GTACACGAGG -5324 
AGAGGCCTGG GCGGCAGGGC TATGAGCACG GCAGGGCCAC CGGGGAGAGA GTCCCCGGCC TGGGAGGCTG -5254 
ACAGCAGGAC CACTGACCGT CCTCCCTGGG AGCTGCCACA TTGGGCAACG CGAAGGCGGC CACGCTGCGT -5184 
GTGACTCAGG ACCCCATACC GGCTTCCTGG GCCCACCCAC ACTAACCCAG GAAGTCACGG AGCTCTGAAC -5114 
CCGTGGAAAC GAACATGACC CTTGCCTGCC TGCTTCCCTG GGTGGGTCAA GGGTAATGAA GTGGTGTGCA -5044 
GGAAATGGCC ATGTAAATTA CACGACTCTG CTGATGGGGA CCGTTCCTTC CATCATTATT CATCTTCACC -4974 
CCCAAGGACT GAATGATTCC AGCAACTTCT TCGGGTGTGA CAAGCCATGA CAAAACTCAG TACAAACACC -4904 
ACTCTTTTAC TAGGCCCACA GAGCACGGSC CACACCCCTG ATATATTAAG AGTCCAGGAG AGATGAGGCT -4834 
GCTTTCAGCC ACCAGGCTGG GGTGACAACA GCGGCTGAAC AGTCTGTTCC TCTAGACTAG TAGACCCTGG -4764 
CAGGCACTCC CCCAGATTCT AGGGCCTGGT TGCTGCTTCC CGAGGGCGCC ATCTGCCCTG GAGACTCAGC -4 694 
CTGGGGTGCC ACACTGAGGC CAGCCCTGTC TCCACACCCT CCGCCTCCAG GCCTCAGCTT CTCCAGCAGC -4624 
TTCCTAAACC CTGGGTGGGC CGTGTTCCAG CGCTACTGTC TCACCTGTCC CACTGTGTCT TGTCTCAGCG -4554 
ACGTAGCTCG CACGGTTCCT CCTCACATGG GGTGTCTGTC TCCTTCCCCA ACACTCACAT GCGTTGAAGG -4484 
GAGGAGATTC TGCGCCTCCC AGACTGGCTC CTCTGAGCCT GAACCTGGCT CGTGGCCCCC GATGCAGGTT -4414 
CCTGGCGTCC GGCTGCACGC TGACCTCCAT TTCCAGGCGC TCCCCGTCTC CTGTCATCTG CCGGGGCCTG -4344 
CCGGTGTGTT CTTCTGTTTC TGTGCTCCTT TCCACGTCCA GCTGCGTGTG TCTCTGCCCG CTAGGGTCTC -4274 
GGGGTTTTTA TAGGCATAGG ACGGGGGCGT GGTGGGCCAG GGCGCTCTTG GGAAATGCAA CATTTGGGTG -4204 
TGAAAGTAGG AGTGCCTGTC CTCACCTAGG TCCACGGGCA CAGGCCTGGG GATGGAGCCC CCGCCAGGGA -4134 
CCCGCCCTTC TCTGCCCAGC ACTTTCCTGC CCCCCTCCCT CTGGAACACA GAGTGGCAGT TTCCACAAGC -4064 
ACTAAGCATC CTCTTCCCAA AAGACCCAGC ATTGGCACCC CTGGACATTT GCCCCACAGC CCTGGGAATT -3994 
, c-Mxc 



jCACGTGK CTA CGCACATCAT GTACACACTC CCGTCCACGA CCGACCCCCG CTGTTTTATT TTAATAGCTA -3924 
CAAAGCAGGG AAATCCCTGC TAAAATGTCC TTTAACAAAC TGGTTAAACA AACGGGTCCA TCCGCACGGT -3854 
GGACAGTTCC TCACAGTGAA GAGGAACATG CCGTTTATAA AGCCTGCAGG CATCTCAAGG GAATTACGCT -3784 
GAGTCAAAAC TGCCACCTCC ATGGGATACG TACGCAACAT GCTCAAAAAG AAAGAATTTC ACCCCATGGC -3714 
AGGGGAGTGG TTAGGGGGGT TAAGGACGGT GGGGGCGGCA GCTGGGGGCT ACTGCACGCA CCTTTTACTA -3644 
AAGCCAGTTT CCTGGTTCTG ATGGTATTGG CTCAGTTATG GGAGACTAAC CATAGGGGAG TGGGGATGGG -3574 
GGAACCCGGA GGCTGTGCCA TCTTTGCCAT GCCCGAGTGT CCTGGGCAGG ATAATGCTCT AGAGATGCCC -3504 
ACGTCCTGAT TCCCCCAAAC CTGTGGACAG AACCCGCCCG GCCCCAGGGC CTTTGCAGGT GTGATCTCCG -3434 
TGAGGACCCT GAGGTCTGGG ATCCTTCGGG ACTACCTGCA GGCCCGAAAA GTAATCCAGG GGTTCTGGGA -3364 
AGAGGCGGGC AGGAGGGTCA GAGGGGGGCA GCCTCAGGAC GATGGAGGCA GTCAGTCTGA GGCTGAAAAG -3294 
GGAGGGAGGG CCTCGAGCCC AGGCCTGCAA GCGCCTCCAG AAGCTGGAAA AAGCGGGGAA GGGACCCTCC -3224 
ACGGAGCCTG CAGCAGGAAG GCACGGCTGG CCCTTAGCCC ACCAGGGCCC ATCGTGGACC TCCGGCCTCC -3154 
GTGCCATAGG AGGGCACTCG CGCTGCCCTT CTAGCATGAA GTGTGTGGGG ATTTGCAGAA GCAACAGGAA -3084 
ACCCATGCAC TGTGAATCTA GGATTATTTC AAAACAAAGG TTTACAGAAA CATCCAAGGA CAGGGCTGAA -3014 
GTGCCTCCGG GCAAGGGCAG GGCAGGCACG AGTGATTTTA TTTAGCTATT TTATTTTATT TACTTACTTT -2944 
CTGAGACAGA GTTATGCTCT TGTTGCCCAG GCTGGAGTGC AGCGGCATGA TCTTGGCTCA CTGCAACCTC -287 4 
CGTCTCCTGG GTTCAAGCAA TTCTCGTGCC TCAGCCTCCC AAGTAGCTGG GATTTCAGGC GTGCACCACC -2804 
ACACCCGGCT AATTTTGTAT TTTTAGTAGA GATGGGCTTT CACCATGTTG GTCAAGCTGA TCTCAAAATC -2734 
CTGACCTCAG GTGATCCGCC CACCTCAGCC TCCCAAAGTG CTGGGATTAC AGGCATGAGC CACTGCACCT -2664 
GGCCTATTTA ACCATTTTAA AACTTCCCTG GGCTCAAGTC ACACCCACTG GTAAGGAGTT CATGGAGTTC -2594 
AATTTCCCCT TTACTCAGGA GTTACCCTCC TTTGATATTT TCTGTAATTC TTCGTAGACT GGGGATACAC -2524 
CGTCTCTTGA CATATTCACA GTTTCTGTGA CCACCTGTTA TCCCATGGGA CCCACTGCAG GGGCAGCTGG -2454 
GAGGCTGCAG GCTTCAGGTC CCAGTGGGGT TGCCATCTGC CAGTAGAAAC CTGATGTAGA ATCAGGGCGC -2384 
AAGTGTGGAC ACTGTCCTGA ATCTCAATGT CTCAGTGTGT GCTGAAACAT GTAGAAATTA AAGTCCATCC -2314 
CTCCTACTCT ACTGGGATTG AGCCCCTTCC CTATCCCCCC CCAGGGGCAG AGGAGTTCCT CTCACTCCTG -224 4 
TGGAGGAAGG AATGATACTT TGTTATTTTT CACTGCTGGT ACTGAATCCA CTGTTTCATT TGTTGGTTTG -2174 
TTTGTTTTGT TTTGAGAGGC GGTTTCACTC TTGTTGCTCA GGCTGGAGGG AGTGCAATGG CGCGATCTTG -2104 
GCTTACTGCA GCCTCTGCCT CCCAGGTTCA AGTGATTCTC CTGCTTCCGC CTCCCATTTG GCTGGGATTA -2034 
CAGGCACCCG CCACCATGCC CAGCTAATTT TTTGTATTTT TAGTAGAGAC GGGGGTGGGT GGGGTTCACC -1964 
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ATGTTGGCCA GGCTGGTCTC GAACTTCTGA CCTCAGATGA TCCACCTGCC TCTGCCTCCT AAAGTGCTGG -1894 
GATTACAGGT GTGAGCCACC ATGCCCAGCT CAGAATTTAC TCTGTTTAGA AACATCTGGG TCTGAGGTAG -1824 

CAAT-Box 

GAAGCTCACC CCACTCAAGT GTTGTGGTGT TTTAP fGCCAA~Tb ATAGAATT TTTTTATTGT TGTTAGAACA -1754 

CTCTTGATGT TTTACACTGT GATGACTAAG ACATCATCAG CTTTTCAAAG ACACACTAAC TGCACCCATA -1684 

ATACTGGGGT GTCTTCTGGG TATCAGCAAT CTTCATTGAA TGCCGGGAGG CGTTTCCTCG CCATGCACAT -1614 

GGTGTTAATT ACTCCAGCAT AATCTTCTGC 7TCCATTTCT TCTCTTCCCT CTTTTAAAAT TGTGTTTTCT -1544 

ATGTTGGCTT CTCTGCAGAG AACCAGTGTA AGCTACAACT TAACTTTTGT TGGAACAAAT TTTCCAAjccl -147 4 
Spi 

[GCCCj CTTTGC CCTAGTGGCA GAGACAATTC ACAAACACAG CCCTTTAAAA AGGCTTAGGG ATCACTAAGG -14 04 

GGATTTCTAG AAGAGCGACC TGTAATCCTA AGTATTTACA AGACGAGGCT AACCTCCAGC GAGCGTGACA -1334 

GCCCAGGGAG GGTGCGAGGC CTGTTCAAAT GCTAGCTCCA TAAATAAAGC AATTTCCTCC GGCAGTTTCT -1264 

GAAAGTAGGA AAGGTTACAT TTAAGGTTGC GTTTGTTAGC ATTTCAGTGT TTGCCGACCT CAGCTACAGC -1194 

ATCCCTGCAA GGCCTCGGGA GACCCAGAAG TTTCTCGCCC CCTTAGATCC AAACTTGAGC AACCCGGAGT -1124 

CTGGATTCCT GGGAAGTCCT CAGCTGTCCT GCGGTTGTGC CGGGGCCCCA GGTCTGGAGG GGACCAGTGG -1054 

CCGTGTGGCT TCTACTGCTG GGCTGGAAGT CGGGCCTCCT AGCTCTGCAG TCCGAGGCTT GGAGCCAGGT -984 

GCCTGGACCC CGAGGCTGCC CTCCACCCTG TGCGGGCGGG ATGTGACCAG ATGTTGGCCT CATCTGCCAG -914 

ACAGAGTGCC GGGGCCCAGG GTCAAGGCCG TTGTGGCTGG TGTGAGGCGC CCGGTGCGCG GCCAGCAGGA -84 4 
CCAC-Box Spi 

GCGCCTGGCT CCATTT jCCCA CCCj TTTCTCG ACGGGAc jcGC CCCfc GTGGGT GATTAACAGA TTTGGGGTGG -774 

TTTGCTCATG GTGGGGACCC CTCGCCGCCT GAGAACCTGC AAAGAGAAAT GACGGGCCTG TGTCAAGGAG -704 

CCCAAGTCGC GGGGAAGTGT TGCAGGGAGG CACTCCGGGA GGTCCCGCGT GCCCGTCCAG GGAGCAATGC -634 
AP-2 

GTCCTCGGGT TCC ftCCCCAG CCCj CGTCTAC GCGCCTCCGT CCTCCCCTTC ACGTCCGGCA TTCGTGGTGC -564 

CCGGAGCCCG ACGCCCCGCG TCCGGACCTG GAGGCAGCCC TGGGTCTCCG GATCAGGCCA GCGGCCAAAG -4 94 

GGTCGCCGCA CGCACCTGTT CCCAGGGCCT CCACATCATG GCCCCTCCCT CGGGTTACCC CACAGCCTAG -424 

Spi 

GCCGATTCGA CCTCTCTCCG CTGGGGCCCT CGCTGGCGTC CCTGCACCCT GGGAGCGCGA GCGGC |GCGCG] -354 

Spi 

[GGCCj GGGAAG CGCGGCCCAG ACCCCCGGGT ICCGCCd GGAG CAGCTGCGCT GTCGGGGCCA GGCCGGGCTC -284 

c-Mvc 

CCAGTGGATT CGCGGGCACA GACGCCCAGG ACCGCGCTCC dCACGTGbCG GAGGGACTGG GGACCCGGGC -214 

Spi 

ACCCGTCCTG CCCCTTCACC TTCCAGCTCC GCCTCCTCCG CGCGGACdCC GCCCtGTCCC GACCCCTCCC -144 

Spi 

GGGTCCCCGG CCCAGCCCCC TCCGGGCCCT CCCAGCCC CT CCCCTTCCTT TCCGCGGCCfc CGCCCfrCTCC -74 

o-Mvc 

TCGCGGCGCG AGTTT CAGGC AGCGCTGCGT CCTGCTGC qC ACGTGfc GAAG CCCTGGCCCC GGCCACCCCC -4 

GCGATC 3 
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SEQUENZPROTOKOLL 

<no> Bayer AG 

<120> Regulatorische DNA-Sequenzen aus der Si-Region vom Gen 
der humanen katalytischen Telomerase-Untereinheit und 
deren diagnostische und therapeutische Verwendung 

<13 0> LeA32805-Ausland 

<140> 
<141> 

<160> 20 

<170» Patentln Vers. 2.0 

<210> 1 
<2U> 5126 
<2L2> DNA 

<213> Homo sapiens 
<400> 1 

gagccccgaa ccgtggaaac gaacatgacc cttgcctgcc tgcttccctg ggcgggtcaa 60 
gggcaatgaa gtggtgtgca ggaaatggcc atgtaaatta cacgactctg ccgatgggga 120 
ccgttccttc catcattatt catcttcacc cccaaggacc gaatgattcc agcaacttct 180 
ccgggtgtga caagccatga caaaactcag tacaaacacc acccttttac taggcccaca 240 
gagcacgggc cacacccctg atatattaag agcccaggag agatgaggct gctttcagcc 300 
accaggctgg ggtgacaaca gcggctgaac agtctgttcc cctagactag tagaccctgg 360 
caggcactcc cccaaatcct agggcctggt cgctgcttcc cgagggcgcc atctgccctg 420 
gagactcagc ctggggcgcc acactgaggc cagccctgtc tccacaccct ccgcctccag 4 80 
gcctcagctt ctccagcagc ttcccaaacc ccgggtgggc cgtgtcccag cgctactgtc 540 
tcacctgtcc cactgtgtct tgtctcagcg acgtagctcg cacggttcct cctcacatgg 600 
ggtgtctgtc tccttcccca acactcacat gcgttgaagg gaggagattc tgcgcctccc 660 
agactggctc ctctgagcct gaacctggcc cgtggccccc gatgcaggtt cctggcgtcc 720 
ggctgcacgc tgacccccat ttccaggcgc tccccgtctc ctgccatctg ccggggcctg 780 
ccggtgtgtt cttctgcttc tgtgctcctt tccacgtcca gccgcgtgtg tctctgcccg 840 
ctagggcctc ggggttttta taggcatagg acgggggcgt ggtgggccag ggcgctcttg 900 
ggaaatgcaa catttgggtg tgaaagtagg agtgcctgtc ctcacctagg tccacgggca 960 
caggcctggg gatggagccc ccgccaggga cccgcccttc tctgcccagc actttcctgc 1020 
ccccccccct ctggaacaca gagcggcagt ttccacaagc actaagcatc ctcctcccaa 1080 
aagacccagc attggcaccc ctggacactt gccccacagc cctgggaatc cacgtgacta 114 0 
cgcacatcat gtacacactc ccgtccacga ccgacccccg ctgttttatt ttaatagcca 1200 
caaagcaggg aaatccctgc taaaatgtcc tttaacaaac tggtcaaaca aacgggtcca 1260 
tccgcacggc ggacagttcc tcacagtgaa gaggaacatg ccgtctataa agcctgcagg 1320 
catctcaagg gaattacgct gagtcaaaac tgccaccccc atgggatacg tacgcaacat 13 80 
gctcaaaaag aaagaacttc accccatggc aggggagtgg ttaggggggt taaggacggt 144 0 
gggggcggca gctgggggct actgcacgca ccttttacta aagccagttt cctggttctg 1500 
atggtattgg ctcagttatg ggagactaac cacaggggag tggggatggg ggaacccgga 1560 
ggctgtgcca tctccgccat gcccgagtgt cctgggcagg acaatgctct agagatgccc 1620 
acgtcctgat tcccccaaac ctgtggacag aacccgcccg gccccagggc ctttgcaggt 1680 
gtgatctccg tgaggaccct gaggtccggg atcccccggg actacctgca ggcccgaaaa 174 0 
gtaatccagg ggttctggga agaggcgggc aggagggtca gaggggggca gcctcaggac 1800 
gatggaggca gtcagcctga ggctgaaaag ggagggaggg cctcgagccc aggcctgcaa 1860 
gcgcccccag aagctggaaa aagcggggaa gggaccctcc acggagcctg cagcaggaag 1920 
gcacggctgg cccttagccc accagggccc atcgtggacc cccggcctcc gtgccatagg 1980 
agggcactcg cgccgccctt ctagcatgaa gtgtgtgggg atttgcagaa gcaacaggaa 2040 
acccatgcac tgtgaatcta ggattatttc aaaacaaagg tttacagaaa catccaagga 2100 
cagggctgaa gtgcctccgg gcaagggcag ggcaggcacg agtgatttta tttagctatt 2160 
ttattttatt tacttacttt ctgagacaga gttatgctct tgttgcccag gctggagtgc 2220 
agcggcatga tcttggctca ctgcaacccc cgtctcccgg gtccaagcaa ttctcgcgcc 2280 
tcagcctccc aagtagctgg gatttcaggc gtgcaccacc acacccggcc aattttgtat 2340 
ttttagtaga gatgggcttt caccatgttg gtcaagctga tctcaaaatc ctgacctcag 2400 
gtgatccgcc cacctcagcc tcccaaagtg ccgggattac aggcatgagc cactgcaccc 2460 
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ggcctattta accattteaa aacttccctg ggctcaagtc acacccactg gtaaggagtt 2520 
catggagttc aatttcccct ttactcagga gtcaccctcc tttgatattt tccgcaattc 2580 
ttcgtagact ggggatacac cgtctcttga cacatccaca gtttctgtga ccacctgtta 2640 
tcccatggga cccactgcag gggcagctgg gaggctgcag gcttcaggtc ccagtggggt 2700 
tgccatc*:gc cagtagaaac ctgatgtaga atcagggcgc aagtgtggac actgtcctga 2760 
atctcaatgt ctcagtgtgt gccgaaacat gtagaaatta aagtccatcc ctcctactct 2820 
actgggattg agccccttcc ccatcccccc ccaggggcag aggagttcct ctcactcctg 2880 
cggaggaagg aatgacactt tgttattttt caccgctggt accgaatcca ctgtttcatt 2940 
tgttggttcg cctgtcttgt tttgagaggc ggtttcactc ttgttgctca ggctggaggg 3000 
agtgcaatgg cgcgatcttg gcttactgca gcctctgcct cccaggttca agtgattctc 3 060 
ccgcttccgc ctcccatttg gctgggatta caggcacccg ccaccatgcc cagctaattt 3120 
tttgtatttt tagtagagac gggggtgggt ggggttcacc atgttggcca ggctggtctc 3180 
gaacttccga cctcagacga tccacctgcc tctgcccccc aaagcgctgg gattacaggt 3240 
gcgagccacc atgcccagct cagaatttac tccgtttaga aacatctggg tctgaggcag 3 300 
gaagctcacc ccactcaagt gttgtggtgt tctaagccaa tgatagaatt tttttactgt 3360 
tgttagaaca ctcttgatgt tttacactgt gatgactaag acatcatcag cttttcaaag 3420 
acacactaac tgcacccata atactggggt gtcttctggg tatcagcaat cttcattgaa 3480 
tgccgggagg cgtttcctcg ccatgcacat ggtgttaatt actccagcat aatcttctgc 354 0 
ccccatcccc cctcttccct cttttaaaat tgtgttttcc atgttggctt ctccgcagag 3600 
aaccagtgta agccacaact caactcctgc cggaacaaac ttcccaaacc gccccttcgc 3660 
cctagtggca gagacaattc acaaacacag cccttcaaaa aggcttaggg atcactaagg 372 0 
ggatctctag aagagcgacc tgcaatccta agtatttaca agacgaggct aacccccagc 378 0 
gagcgcgaca gcccagggag ggtgcgaggc ctgctcaaac gccagctcca caaataaagc 3 84 0 
aatttcctcc ggcagcttct gaaagtagga aaggttacat ttaaggttgc gtttgttagc 3 900 
acttcagtgt ctgccgaccc cagctacagc atccctgcaa ggcctcggga gacccagaag 3 960 
tttctcgccc ccttagatcc aaacttgagc aacccggagc ctggattcct gggaagcccc 4020 
cagctgtcct gcggttgtgc cggggcccca ggtctggagg ggaccagtgg ccgcgtggcc 4 080 
tctactgctg ggctggaagt cgggcctcct agctctgcag cccgaggctt ggagccaggt 414 0 
gcctggaccc cgaggctgcc ctccaccctg tgcgggcggg atgtgaccag atgttggcct 4 200 
catctgccag acagagcgcc ggggcccagg gtcaaggccg ttgtggctgg tgtgaggcgc 4260 
ccggcgcgcg gccagcagga gcgcccggct ccatttccca cccttccccg acgggaccgc 4 320 
cccggtgggt gattaacaga cccggggtgg tttgctcatg gcggggaccc ctcgccgcct 4380 
gagaacctgc aaagagaaat gacgggcctg tgccaaggag cccaagtcgc ggggaagcgt 444 0 
cgcagggagg caccccggga ggtcccgcgt gcccgtccag ggagcaatgc gtcctcgggt 4500 
ccgtccccag ccgcgtctac gcgcctccgt cctccccttc acgtccggca ttcgtggtgc 4560 
ccggagcccg acgccccgcg tccggacccg gaggcagccc tgggtctccg gatcaggcca 4 620 
gcggccaaag ggtcgccgca cgcacctgtt cccagggccc ccacatcatg gcccctccct 4680 
cgggttaccc cacagcctag gccgattcga cctctctccg ctggggccct cgctggcgtc 474 0 
cctgcaccct gggagcgcga gcggcgcgcg ggcggggaag cgcggcccag acccccgggc 4 800 
ccgcccggag cagctgcgcc gtcggggcca ggccgggccc ccagtggatt cgcgggcaca 4 86 0 
gacgcccagg accgcgctcc ccacgcggcg gagggactgg ggacccgggc acccgtcctg 4 920 
cccctccacc ttccagctcc gcctcctccg cgcggacccc gccccgtccc gacccctccc 4 980 
gggtccccgg cccagccccc tccgggccct cccagcccct ccccttcctt cccgcggccc 5040 
cgccctctcc tcgcggcgcg agtttcaggc agcgctgcgc cctgctgcgc acgtgggaag 5100 
ccctggcccc ggccaccccc gcgatg 5126 

<2X0> 2 

<211> 4042 

<212> DNA 

<213> Homo sapiens 

<400> 2 

gtcccaggca gcgctgcgtc ctgctgcgca cgtgggaagc cctggccccg gccacccccg 60 
cgatgccgcg cgctccccgc tgccgagccg tgcgcccccc gctgcgcagc cactaccgcg 120 
aggtgctgcc gctggccacg ttcgtgcggc gcctggggcc ccagggccgg cggctggtgc 180 
agcgcgggga cccggcggct ctccgcgcgc tggtggccca gtgcctggtg tgcgtgccct 240 
gggacgcacg gccgcccccc gccgccccct ccttccgcca ggtgtcctgc ctgaaggagc 300 
tggtggcccg agtgctgcag aggctgtgcg agcgcggcgc gaagaacgtg ctggccttcg 3 60 
gcctcgcgct gctggacggg gcccgcgggg gcccccccga ggccttcacc accagcgtgc 420 
gcagccaccc gcccaacacg gtgaccgacg cactgcgggg gagcggggcg tgggggctgc 4 80 
cgccgcgccg cgtgggcgac gacgtgctgg ttcacctgcc ggcacgccgc gcgctctttg S4 0 
tgctggtggc tcccagctgc gcctaccagg tgtgcgggcc gccgctgtac cagctcggcg 600 
ctgccactca ggcccggccc ccgccacacg ccagcggacc ccgaaggcgt ccgggatgcg 66 0 
aacgggcctg gaaccatagc gtcagggagg ccggggtccc cctgggcctg ccagccccgg 72 0 
gcgcgaggag gcgcgggggc agtgccagcc gaagcctgcc gttgcccaag aggcccaggc 780 
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gtggcgctgc ccctgagccg gagcggacgc ccgttgggca ggggtcctgg gcccacccgg 840 
gcaggacgcg tggaccgagt gaccgtggtt tctgtgtggt gtcacctgcc agacccgccg 900 
aagaagccac ctctttggag ggtgcgccct ctggcacgcg ccactcccac ccatccgtgg 9 SO 
gccgccagca ccacgcgggc cccccatcca catcgcggcc accacgtccc tgggacacgc 1020 
cttgtccccc ggtgtacgcc gagaccaagc acttcctcta ctcctcaggc gacaaggagc 1080 
agctgcggcc ctccttccta ctcagctctc tgaggcccag cctgactggc gctcggaggc 114 0 
ccgtggagac cacccttctg ggttccaggc cctggatgcc agggactccc cgcaggttgc 1200 
cccgcctgcc ccagcgctac tggcaaatgc ggcccctgtt tctggagctg cttgggaacc 1260 
acgcgcagtg cccctacggg gtgctcctca agacgcactg cccgctgcga gctgcggtca 1320 
ccccagcagc cggtgtctgt gcccgggaga agccccaggg ccctgcggcg gcccccgagg 1380 
aggaggacac agacccccgt cgcctggtgc agccgccccg ccagcacagc agcccctggc 144 0 
aggtgtacgg cttcgtgcgg gcccgcccgc gccggctggc gcccccaggc ctctggggct 1500 
ccaggcacaa cgaacgccgc ctcctcagga acaccaagaa gttcatctcc ctggggaagc 1560 
atgccaagct ctcgctgcag gagctgacgt ggaagatgag cgtgcgggac tgcgcttggc 162 0 
tgcgcaggag cccaggggtt ggctgtgctc cggccgcaga gcaccgtctg cgtgaggaga 1680 
tcctggccaa gttcctgcac tggctgacga gtgtgtacgt cgtcgagctg ctcaggtctt 1740 
cctcctacgc cacggagacc acgtttcaaa agaacaggct ctttttctac cggaagagtg 1800 
tctggagcaa gttgcaaagc attggaatca gacagcactt gaagagggtg cagctgcggg 1860 
agccgtcgga agcagaggtc aggcagcatc gggaagccag gcccgccctg ccgacgtcca 1920 
gactccgctt catccccaag cccgacgggc tgcggccgat tgtgaacatg gactacgtcg 1980 
tgggagccag aacgttccgc agagaaaaga gggccgagcg tctcacctcg agggtgaagg 204 0 
caccgtccag cgtgctcaac tacgagcggg cgcggcgccc cggcctcctg ggcgcccctg 2100 
cgccgggcct ggacgatatc cacagggcct ggcgcaccct cgtgctgcgt gtgcgggccc 2160 
aggacccgcc gcctgagctg tactttgtca aggtggatgt gacgggcgcg cacgacacca 2220 
ccccccagga caggctcacg gaggtcatcg ccagcatcat caaaccccag aacacgtact 2280 
gcgtgcgccg gtatgccgcg gtccagaagg ccgcccacgg gcacgcccgc aaggccttca 2340 
agagccacgt ctctaccttg acagaccccc agccgtacat gcgacagttc gtggctcacc 24 00 
cgcaggagac cagcccgctg agggatgccg tcgtcatcga gcagagctcc tccctgaatg 2460 
aggccagcag tggcctcttc gacgtcttcc tacgcttcat gcgccaccac gccgtgcgca 2520 
tcaggggcaa gtcctacgtc cagtgccagg ggatcccgca gggctccatc ctctccacgc 2580 
tgctctgcag cctgtgctac ggcgacatgg agaacaagct gtctgcgggg atccggcggg 2640 
acgggctgct cctgcgtttg gtggatgatt tcttgttggt gacacctcac ctcacccacg 2700 
cgaaaacctt cctcaggacc ctggtccgag gtgtccctga gtatggctgc gtggtgaact 2760 
tgcggaagac agtggtgaac ccccccgcag aagacgaggc cctgggtggc acggcctttg 2820 
cccagatgcc ggcccacggc ctatccccct ggtgcggcct gctgctggat acccggaccc 2880 
tggaggtgca gagcgactac cccagctatg cccggacctc catcagagcc agtctcaccc 2940 
tcaaccgcgg cttcaaggct gggaggaaca tgcgccgcaa actctttggg gtcttgcggc 3000 
tgaagtgtca cagcctgttt ccggatttgc aggtgaacag cctccagacg gtgtgcacca 3060 
acatctacaa gatcctcctg ctgcaggcgt acaggtttca cgcatgtgtg ctgcagctcc 3120 
catttcatca gcaagtttgg aagaacccca catttttcct gcgcgtcatc cctgacacgg 3180 
cccccctctg ctaccccacc ctgaaagcca agaacgcagg gatgtcgctg ggggccaagg 3240 
gcgccgccgg ccctctgccc tccgaggccg tgcagtggct gtgccaccaa gcacccctgc 3 3 00 
tcaagctgac tcgacaccgt gccacctacg tgccactcct ggggtcactc aggacagccc 33 60 
agacgcagct gagtcggaag ctcccgggga cgacgctgac tgccctggag gccgcagcca 3420 
acccggcact gccctcagac ttcaagacca tcctggactg atggccaccc gcccacagcc 34 80 
aggccgagag cagacaccag cagccctgtc acgccgggct ctacgtccca gggagggagg 3540 
ggcggcccac acccaggccc gcaccgctgg gagcctgagg cctgagtgag tgtttggccg 3600 
aggcctgcat gtccggctga aggctgagtg tccggctgag gcctgagcga gtgtccagcc 3660 
aagggccgag tgtccagcac acctgccgtc ttcacttccc cacaggctgg cgctcggctc 3720 
caccccaggg ccagcttttc ctcaccagga gcccggcttc cactccccac ataggaatag 3780 
tccaccccca gattcgccat tgttcacccc tcgccctgcc ctcctttgcc tcccaccccc 3840 
accatccagg tggagaccct gagaaggacc ctgggagctc tgggaatttg gagcgaccaa 3 900 
aggtgtgccc tgtacacagg cgaggaccct gcacctggac gggggtccct gtgggtcaaa 3 960 
ccggggggag gtgctgtggg agtaaaatac tgaatatatg agtttttcag ccctgaaaaa 4020 
aaaaaaaaaa aaaaaaaaaa aa 404 2 

<210> 3 

<211> 11276 

<212> DNA 

<213> Homo sapiens 

<400> 3 

acccgagccc aagagttcaa ggctacggtg agccatgact gcaacaccac acgccagcct 60 
tggcgacaga atgagaccct gtctcaaaaa aaaaaaaaaa aattgaaata atataaagca 120 
tcttccctgg ccacagtgga acaaaaccag aaaccaacaa caagaggaac tttgaaaact 180 
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atacaaacac atgaaaatca aacaatacac 
ttaaaaagga aatcgaaaaa tttatttaag 
acccacggta tacagcaaaa gcagtgctaa 
tcaaaaaagt agaaaagcca ggcgcagtgg 
gccaaggcgg gcagatcgcc tgaggtcagg 
aaccttgtcg ctactaaaaa tacaaaatca 
cagctactcg ggaggctgag gcaggataac 
gagccgggat tgcgccattg gaccccagcc 
aaaaaaaaaa aagtagaaaa acttaaaaac 
aaaagcaaga gcaaactaaa cctaaaattg 
cagaaacaaa tgaaactgaa agataacaac 
ttttgaaaag ataaacaaaa ttgacaaacc 
acctaaataa ataaagtcag agacgaaaaa 
caaaggatca ctagaggcta ctatgagcaa 
aaaatagata aatccctaga tgcatacaac 
agcccaaaca gaccaataac aataatggga 
agagaagccc aggacccaat ggcctccctg 
gaattccaat cctactcaaa ctattctgaa 
tctacatggc cagtattacc ctgattccaa 
aacaaaaaaa cagaaagaaa gaaaactaca 
aaatcctcaa caaaacacta gcaaaccaaa 
gtgatcaagt gggatttatc ccagggatgg 
atgtgataca tcatcccaac aaaacgaagt 
cagaaaaagc actcgataaa attctgcacc 
tatacaagaa acatacaggc caggcacagt 
aggccaaggt gggatgattg cttgggccca 
gagacctggt ctacaaaaaa cttttttaaa 
tagtcccagc tagtctggag gccgaggtgg 
tgcagtgagc catgaacatg tcactgtact 
gaacaagaag aaggagaagg agaagggaga 
aggaggtgga ggagaagcgg aaggggaagg 
tttcaacata ataaaagccc tacatgacag 
agccctccct ctaagatctg gaaaatgaca 
tagtactaga agtcctagct agagcaacca 
ctggaaagga agaagtcaaa ttatcctgtt 
gacttaagac accaccaaaa aaccattaga 
caatgtacaa aaatcagtag tatttctata 
caaaaaagca gctacaaata aaactaaaca 
cctacaatga aaactataaa atgttgataa 
agacactcca cgttcataga ttggaagaat 
agcaatttac aaatccaacg caatccctat 
agaagaaaca attctaagat ttgcacagaa 
cctgaccaaa aagaacaaaa ccggaagcat 
agctatagca acccaaacta catggtactg 
gaacagaata gagaacccag aaacaaatcc 
aggcgccaag aacacacttt ggggaaaaga 
ctggatatcc atatgcaaaa taacaatact 
aaatcaaaac ggatgaaagg cttaaatcta 
aacaccggag aaacccccca ggacattgga 
caggcacagg caaccaaagc aaaaacagac 
tgcccagcaa aggaaacaat caacaaagag 
tttgcaaact attcatctaa caaggaatta 
ctccataaga aaaacaccta ataagctgat 
catttctcaa aataagtcat acaaacggca 
ctgatcacca gagaaatgca aatcaaaact 
atggctccca ttcaaaagac aggcaataac 
acccctggac actgttggtg ggaatggaaa 
ttcctcaaaa aactaaaaac aaagctacca 
caaaaaaggg aaccagtgca tcaacaagct 
ttcatagcag ccaaggcttg gaagcaaccc 
aaaacgtggt gcacatacac aatggagtac 
tcagtcgcaa cagcatgggg ggcaccggtc 
aaagacaaac ttctcatgtt ctcccttacc 
agaaatagag gagaacggtg gccccagagg 
taatttattg tatgtcttaa aataactaaa 



tcctgaatga ccagtgagtc aatgaagaaa 240 
caaatgataa cggaaacata acctctcaaa 300 
gaaggaagtt tatagctata agcagctaca 360 
ctcacgcctg caatcccagc actttgggag 420 
agttcgagac cagcctgacc aacacagaga 480 
gccgggcatg gtggcacatg cctgtaatcc 54 0 
cgcttgaacc caggaggtgg aggttgcggc 600 
tgggcaacaa gagtgaaacc ctgtctcaag 660 
acaacctaac gatgcacctt aaagaactag 720 
gtaaaagaaa agaaataata aagatcagag 780 
acaaaagatc aacaaaatta aaagttggtt 840 
tttgcccaga ccaagaaaaa aggaaagaag 900 
agagacatca caactgatac cacagaaact 960 
ctgtacacta ataaattgaa aaacctagaa 1020 
ctaccaagat tgaaccatga agaaatccaa 1080 
ttaaagccat aataaaaagt ctcctagcaa 1140 
ctggatttta ccaatcactc aaagaagaat 1200 
aaatagagga aagaatactt ccaaactcat 1260 
aaccagacaa aaacacatca aaaacaaaca 1320 
ggccaacatc cctgatgaat actgatacaa 1380 
ctaaacaaca ccttcgaaag atcattcatt 144 0 
aaggatggtt caacatatgc aaatcaatca 1500 
acaaaaacta tatgattatt tcactttatg 1560 
cttcatgata aaaaccctca aaaaaccagg 1620 
ggctcacacc tgcgatccca gcactctggg 1680 
ggagcttgag actagcctgg gcaacaaaat 1740 
aaattagcca ggcatgatgg catatgcctg 18 00 
gagaatcact taagcctagg aggtcgaggc 1860 
ccagcctaga caacagaaca agaccccact 1920 
agggagggag aagggaggag gaggagaagg 1980 
ggaagggaaa gaggaagaag aagaaacata 204 0 
accgaggtag tattatgagg aaaaactgaa 2100 
agggcccact tccaccactg tgattcaaca 2160 
gataagagaa agaaataaaa ggcatccaaa 2220 
tgcagatgat atgatcttat atctggaaaa 2280 
gctgaaatct ggtacagcag gatacaaaat 234 0 
ttccaacagc aaacaatctg aaaaagaaac 24 00 
gccaggaatt aaccaaagaa gtgaaagatc 24 60 
aagaaactga agagggcaca aaaaaagaaa 2520 
aaatactgtt aaaatgtcca taccacccaa 2580 
caaaatacta atgacgttct tcacagaaat 2640 
ccacaaaaga cccagaatag ccaaagctat 2700 
cacatcaccc gacttcaaat tataccacaa 2760 
gcataaaaac agacgagaca tggaccagag 2820 
atgcacctac agtgaactca tttttgacaa 2880 
taatctctec aataaatggt gctggaggaa 2940 
agaactctgt ctctcaccac atacaaaagc 3000 
aaacctcaaa ctttgcaact actaaaagaa 3060 
gcgggcaaag acttcttgag taattccctg 3120 
aaatgggatc atatcaagtt aaaaagcttc 3180 
aagagacaac ccacagaatg ggagaatata 3240 
ataaccagta tatataagga gctcaaacca 33 00 
tttcaaaaat aagcaaaaga tctgggtaga 3360 
aacaggcatc tgaaaatgtg ctcaacacca 3420 
actatgagag atcatctcat cccagttaaa 3480 
aaatgccagt gaggatgtgg ataaaaggaa 3540 
ttgctaccac tatggagaac agtttgaaag 3600 
tacagcaatc ccattgctag gtatatactc 3 660 
atccccactc ccacatttac tgcagcactg 3 720 
cagtgtccat caacagacga atggaaaaag 3780 
racgcagcca taaaaaagaa cgagatcctg 3 840 
agtatgttaa gtgaaataag ccaggcacag 3 900 
tgtgggagca aaaattaaaa caattgacat 3 960 
ggtgggggac agggtgacta gagtcaacaa 4 020 
agagtacaac tgggttgttt gtaacacaaa 4080 
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gaaaggataa atgcttgaag gtgacagata ccccatttac cctgatgtga ttattacaca 4140 
ttgtatgcct gtaccaaaac atctcatgta tgctacagat ataaacccta ctatattaaa 4200 
aattaaaatt ctaatggcca ggcacggtgg ctcatgtccg taatcccagc actttgggag 4260 
gccgaggcgg gtggatcacc tgaggtcagg agtttgaaac cagtceggcc accatgatga 4320 
aaccctgtct ctactaaaga tacaaaaatt agccaggcgt ggtggcacat acctgtagtc 43 80 
ccaactactc aggaggctga gacaggagaa ttgcttgaac ctgggaggcg gaggttgcag 4440 
cgagccgaga ccacgccact gcactgcagc ctgggtgaca gagcaagacc ccatctcaaa 4500 
acaaaaacaa aaaaaagaag attaaaattg caatttttat gtaccgtata aatatatact 4560 
ctactatatt agaagttaaa aattaaaaca atcataaaag gtaattaacc acttaatcta 4620 
aaacaagaac aatgtatgtg gggtttctag cctctgaaga agtaaaagtt atggccacga 4680 
tggcagaaat gtgaggaggg aacagtggaa gttactgctg ttagacgctc atactctctg 4740 
taagtgactt aattttaacc aaagacaggc tgggagaagt caaagaggca ttctataagc 4800 
cctaaaacaa ctgctaacaa tggcgaaagg taatctctat taattaccaa taattacaga 4860 
tatctctaaa accgagctgc agaattggca cgcctgatca caccgtcctc ccactcacgg 4 920 
tgcttttttt cttgtgtgct cggagatttt cgattgtgtg ctcgtgtttg gccaaactta 4980 
atctgtatga atcctgaaac gaaaaatggt ggtgatttcc tccagaagaa tcagagtacc 5040 
cggcaggaag caggtggctc tgtggacctg agccactcca atcttcaagg gcctctggcc 5100 
aagacccagg tgcaaggcag aggcctgatg acccgaggac aggaaagctc ggatgggaag 5160 
gggcgatgag aagcccgcct cgttggtgag cagcgcatga agtgccctta tttacgcttt 5220 
gcaaagaccg ctctggatac cacccggaaa aggcggccag cgggaatgca aggagtcaga 5280 
agcctcctgc tcaaacccag gccagcagct atggcgccca cccgggcgtg tgccagaggg 5340 
agaggagtca aggcacctcg aagtatggct taaatctttt tttcacctga agcagtgacc 5400 
aaggtgtact ctgagggaag cttgagttag gtgccttctt taaaacagaa agtcatggaa 5460 
gcacccttct caagggaaaa ccagacgccc gctctgcggt catttacctc tttcctctct 5520 
ccctctcttg ccctcgcggt ttctgatcgg gacagagtga cccccgcgga gctcccccga S580 
gcccgcgccg aggaccctct tgcaaagggc tccacagacc cccgccctgg agagaggagt 564 0 
ctgagcctgg cttaataaca aactgggatg tggctggggg cggacagcga cggcgggatt 5700 
caaagactta attccatgag taaattcaac ctttccacae ccgaatggat ttggatttta 5760 
tcttaatatt ttcccaaatt tcatcaaata acattcagga ctgcagaaat ccaaaggcgt S820 
aaaacaggaa ctgagctatg tttgccaagg tccaaggacc taacaaccac gttcagaggg 58 80 
acttttcgcc ctaagtactt ttcattggtt ttcataaggt ggcttagggt gcaagggaaa 594 0 
gtacacgagg agaggcctgg gcggcagggc tatgagcacg gcagggccac cggggagaga 6000 
gtccccggcc tgggaggctg acagcaggac cactgaccgt cctccctggg agctgccaca 6060 
ttgggcaacg cgaaggcggc cacgctgcgt gtgactcagg accccatacc ggcttcctgg 6120 
gcccacccac accaacccag gaagccacgg agctctgaac ccgtggaaac gaacatgacc 6180 
cctgcctgcc tgcttccctg ggtgggtcaa gggtaatgaa gcggtgcgca ggaaatggcc 6240 
atgtaaatta cacgactctg ctgatgggga ccgttccttc catcattatt catcttcacc 6300 
cccaaggact gaatgattcc agcaactcct ccgggtgtga caagccatga caaaacccag 6360 
tacaaacacc acccttttac taggcccaca gagcacggsc cacacccctg atatattaag 6420 
agcccaggag agatgaggcc gctctcagcc accaggctgg ggcgacaaca gcggctgaac 6480 
agtctgttcc tccagactag tagaccccgg caggcacccc cccagattct agggcctggt 654<T 
cgctgcctcc cgagggcgcc acccgccccg gagacccagc ctggggtgcc acactgaggc 6 600 
cagccctgcc tccacacccc ccgcctccag gcctcagctt ctccagcagc ttcctaaacc 6660 
ctgggtgggc cgtgttccag cgctactgtc tcacctgtcc cactgtgtct tgtctcagcg 6720 
acgcagctcg cacggctcct ccccacatgg ggtgtctgtc tccttcccca acactcacat 6780 
gcgttgaagg gaggagattc tgcgcctccc agactggctc ctccgagcct gaacctggct 6840 
cgtggccccc gatgcaggtt cctggcgtcc ggctgcacgc tgacctccat ttccaggcgc 6900 
tccccgtctc ctgtcatctg ccggggcctg ccggtgtgtt cttctgtttc tgtgctcctt 6960 
tccacgtcca gctgcgtgtg tctctgcccg ctagggtctc ggggttttta taggcacagg 7020 
acgggggcgt ggtrgggccag ggcgctcttg ggaaatgcaa catttgggtg tgaaagtagg 7080 
agtgcctgcc ctcacctagg tccacgggca caggcctggg gatggagccc ccgccaggga 714 0 
cccgccctcc tctgcccagc actttcctgc ccccctccct ctggaacaca gagtggcagt 7200 
ttccacaagc actaagcatc ctccccccaa aagacccagc actggcaccc ctggacattt 7260 
gccccacagc cctgggaatt cacgtgacta cgcacatcat gtacacactc ccgtccacga 7320 
ccgacccccg ccgttttatt ttaatagcta caaagcaggg aaatccctgc taaaatgtcc 7380 
tttaacaaac tggttaaaca aacgggccca tccgcacggt ggacagttcc tcacagtgaa 744 0 
gaggaacatg ccgtttataa agcctgcagg catcccaagg gaactacgct gagtcaaaac 7500 
tgccacctcc atgggatacg tacgcaacat gctcaaaaag aaagaatttc accccatggc 7560 
aggggagtgg ttaggggggt caaggacggt gggggcggca gctgggggct actgcacgca 7620 
ccttttacta aagccagttt cctggttctg atggtattgg ctcagttatg ggagaccaac 7680 
cataggggag tggggatggg ggaacccgga ggctgtgcca cctttgccat gcccgagtgt 774 0 
cctgggcagg ataatgctct agagatgccc acgtcccgat ccccccaaac ctgtggacag 7800 
aacccgcccg gccccagggc ctttgcaggt gtgatctccg tgaggaccct gaggtctggg 7 860 
acccttcggg actacctgca ggcccgaaaa gcaatccagg ggttctggga agaggcgggc 7920 
aggagggtca gaggggggca gcctcaggac gatggaggca gtcagcctga ggctgaaaag 7980 
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ggagggaggg cctcgagccc aggcccgcaa gcgcccccag aagctggaaa aagcggggaa 804 0 
gggaccctcc acggagcctg cagcaggaag gcacggctgg cccttagccc accagggccc 8100 
atcgtggacc tccggcctcc gcgccatagg agggcactcg cgccgccctt ctagcatgaa 8160 
gtgtgtgggg atttgcagaa gcaacaggaa acccatgcac tgtgaatcta ggattatttc 8220 
aaaacaaagg tttacagaaa catccaagga cagggctgaa gtgcctccgg gcaagggcag 8200 
ggcaggcacg agtgatttta tttagctatt ttattttatt tacttacttt ctgagacaga 8340 
gttatgctct tgttgcccag gctggagtgc agcggcatga tcttggctca ctgcaacctc 84 00 
cgtctcctgg gtccaagcaa ctcccgtgcc tcagcctccc aagcagccgg gatttcaggc 8460 
gtgcaccacc acacccggct aattttgtat ctttagtaga gatgggcttt caccacgctg 8520 
gtcaagctga tctcaaaatc ccgacctcag gcgacccgcc caccccagcc tcccaaagtg 8580 
ctgggattac aggcatgagc cactgcacct ggcccatcca accattttaa aacttccctg 8640 
ggcccaagcc acacccactg gtaaggagtt catggagttc aatttcccct ttactcagga 8700 
gttaccctcc tttgatattt tctgtaaccc ttcgtagact ggggatacac cgtctcttga 8760 
catacccaca gtttctgtga ccacctgtca tcccatggga cccaccgcag gggcagccgg 8820 
gaggctgcag gcttcaggtc ccageggggt tgccatctgc cagtagaaac ctgatgtaga 8880 
atcagggcgc aagtgtggac actgtcctga atctcaatgt ctcagtgtgt gccgaaacat 8940 
gtagaaatta aagtccatcc ctcctactct actgggattg agccccttcc ctatcccccc 9000 
ccaggggcag aggagttcct cccactcctg cggaggaagg aatgatactc tgttattttt 9060 
cactgctggt actgaatcca ctgtttcatt tgttggtttg tttgttttgt tttgagaggc 9120 
ggtttcactc ttgttgctca ggctggaggg agtgcaatgg cgcgatcttg gcttactgca 9180 
gcctctgccc cccaggttca agtgattctc ctgcttccgc ctcccatttg gctgggatca 9240 
caggcacccg ccaccatgcc cagctaattt tttgtatttt tagcagagac gggggtgggt 9300 
ggggttcacc acgttggcca ggctggcctc gaacttctga cctcagatga tccacccgcc 9360 
tccgcctcct aaagcgctgg gattacaggt gtgagccacc atgcccagcc cagaatttac 9420 
cctgtttaga aacacctggg tctgaggtag gaagcccacc ccactcaagc gttgtggtgc 9480 
Cttaagccaa tgatagaact tttttattgt tgttagaaca ctcttgatgt tttacactgt 9540 
gatgactaag acatcatcag cttttcaaag acacactaac tgcacccata atactggggt 9600 
gtcttctggg tatcagcaat cttcattgaa tgccgggagg cgtttccccg ccatgcacac 9660 
ggtgttaatt actccagcat aatcttctgc ttccatttct tctcttccct cttttaaaat 9720 
tgtgttttct atgttggctt ctctgcagag aaccagtgta agccacaact taacttttgt 9780 
cggaacaaat ctcccaaacc gcccctttgc cctagtggca gagacaattc acaaacacag 9840 
ccctttaaaa aggcttaggg atcactaagg ggattcctag aagagcgacc tgtaacccta 9900 
agtatttaca agacgaggct aacctccagc gagcgtgaca gcccagggag ggcgcgaggc 9960 
ctgttcaaac gctagctcca taaataaagc aatttcctcc ggcagtttct gaaagcagga 10020 
aaggtcacac ttaaggttgc gttcgttagc atttcagtgt ttgccgaccc cagctacagc 100B0 
atccccgcaa ggcctcggga gacccagaag tttctcgccc ccttagatcc aaacccgagc 10140 
aacccggagt ccggattcct gggaagtcct cagctgtccc gcggttgtgc cggggcccca 10200 
ggtctggagg ggaccagtgg ccgtgtggct tctactgctg ggctggaagt cgggcctcct 10260 
agctccgcag tccgaggctt ggagccaggt gcctggaccc cgaggctgcc ctccaccctg 1032 0 
cgcgggcggg acgtgaccag atgttggcct catctgccag acagagtgcc ggggcccagg 103 80 
gtcaaggccg ctgtggctgg tgtgaggcgc ccggtgcgcg gccagcagga gcgcctggct 10440 
ccatttccca ccctttctcg acgggaccgc cccggtgggt gattaacaga cttggggtgg 10500 
cccgctcatg gcggggaccc ctcgccgcct gagaacctgc aaagagaaat gacgggcctg 10560 
tgtcaaggag cccaagtcgc ggggaagtgt tgcagggagg cactccggga ggtcccgcgt 10620 
gcccgtccag ggagcaatgc gtcctcgggt tcgtccccag ccgcgtctac gcgcctccgt 10680 
cctccccttc acgtccggca ttcgtggtgc ccggagcccg acgccccgcg tccggacctg 10740 
gaggcagccc tgggtctccg gatcaggcca gcggccaaag ggtcgccgca cgcacctgtt 10800 
cccagggcct ccacatcatg gcccctccct cgggttaccc cacagcctag gccgactcga 10860 
cctctctccg ctggggccct cgctggcgtc cctgcaccct gggagcgcga gcggcgcgcg 10920 
ggcggggaag cgcggcccag acccccgggt ccgcccggag cagctgcgct gtcggggcca 10980 
ggccgggctc ccagtggatc cgcgggcaca gacgcccagg accgcgctcc ccacgtggcg 11040 
gagggactgg ggacccgggc acccgtcctg ccccttcacc ttccagctcc gcctcctccg 11100 
cgcggacccc gccccgtccc gacccctccc gggcccccgg cccagccccc tccgggccct 11160 
cccagccccc ccccttcccc tccgcggccc cgccctctcc ccgcggcgcg agtttcaggc 11220 
agcgctgcgt cctgctgcgc acgtgggaag ccctggcccc ggccaccccc gcgatg 11276 

<210> 4 
<211> 104 
<212> DNA 

<213> Homo sapiens 
<400> 4 

gtgggcctcc ccggggtcgg cgcccggccg gggtcgaggg cggccggggg gaaccagcga 60 
catgcggaga gcagcgcagg cgactcaggg cgcctccccc gcag 104 
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<210> 5 
<211> 8616 
<212> DNA 

<213> Homo sapiens 
<400> 5 

gtgaggaggt ggtggccgtc gagggcccag gccccagagc tgaatgcagt aggggctcag 60 
aaaagggggc aggcagagcc ccggccctcc tgtctccatc gtcacgtggg cacacgtggc 120 
ttttcgctca ggacgtcgag tggacacggt gatctctgcc cccgctctcc ctcctgtcca iao 
gtttgcataa acttacgagg ttcaccttca cgttttgatg gacacgcggt ttccaggcgc 240 
cgaggccaga gcagtgaaca gaggaggctg ggcgcggcag tggagccggg tcgccggcaa 3 00 
cggggagaag tgtctggaag cacagacgct ctggcgaggg tgcctgcagg ttacctataa 360 
tcctcttcgc aatttcaagg gtgggaatga gaggtgggga cgagaacccc ctcttcctgg 420 
gggtgggagg taagggtttt gcaggcgcac gtggtcagcc aatatgcagg tttgtgttta 4 80 
agatttaatt gcgtgttgac ggccaggcgc ggtggctcac gccggtaatc ccagcacttt 54 0 
gggaagctga ggcaggtgga tcacctgagg tcaggagtct gagaccagcc tgaccaacat 600 
ggtgaaaccc tatctgtact aaaaatacaa aaattagctg ggcatggtgg tgtgtgcctg 660 
taaccccagc tacttgggag gctgaggcag gagaatcact tgaacccagg aggcggaggc 720 
tgcagtgagc tgagattgtg ccattgtact ccagcccggg cgacaagagt gaaactctgt 780 
ctctaaaaaa aaaaagtgtt cgttgattgt gccaggacag ggtagaggga gggagataag 840 
accgttctcc agcacagatc ctggtcccat ctttaggtat gaagagggcc acatgggagc 900 
agaggacagc agatggctcc acctgccgag gaagggacag tgtttgtggg tgttcagggg 960 
atggtgctgc tgggccctgc cgtgtcccca ccctgttttt ctggatttga cgctgaggaa 1020 
cctccgctcc agcccccttt tggctcccag tgctcccagg ccctaccgtg gcagctagaa 1080 
gaagtcccga cttcaccccc tccccacaaa ctcccaagac atgtaagact tccggccatg 1140 
cagacaagga gggcgacctt cttggggctc ttttttttct ttttttcttt ctatggtggc 1200 
aaaagtcata taacatgaga ctggcactcc taacaccgtt ttctgtgtac agtgcagaat 1260 
tgctaactcg gcggtgttta cagcaggttg cttgaaatgc tgcgtcttgc gtgactggaa 1320 
gtccctaccc atcgaacggc agctgcctca cacccgctgc ggctcaggcg gaccacgccg 13 80 
agtcagataa gcgtcatgca acccagtttt gctctttgtg ctccagcttc cttcgttgag 1440 
gagagtttga gctctctgat caggactctg cctgtcattg ctgttctctg acttcagatg 1500 
aggtcacaac ctgcccctgg cttatgcagg gagtgaggcg tggtccccgg gtgtccctgt 1560 
cacgtgcagg gcgagtgagg cgttgccccc aggtgtccct gtcacgtgta gggtgagtga 1620 
ggcgcggccc ccgggtgtcc ccgtcccgtg cagcgtgatt gaggtgtggc ccccgggtgt 1680 
ccctgtcacg tgtagggtga gcgaggcgcc atccccgggt gtccctgtca cgtgtagggt 1740 
gagtgaggcg tggcccccgg gtgtccctgt cccgtgcagg gtgagtgagg cactgtcccc 1800 
gggtgcccct gtcacgtgca gggtgagtga ggcgcggtcc ccgggtgtcc ctctcaggtg 1860 
tagggtgagt gaggcgcggc cccagggtgt ccctgtcacg tgtagggtga gtgaggcacc 1920 
gtccctgggt gtccctccca ggtatagggt gagtgaggca ctgtccccgg gtgtccctgt 1980 
cacgtgcagg gtgagtgagg cgcggccccc gggtgtccct ctcaggtgca gggtgagtga 204 0 
ggcgctgtcc ctgggtgtcc ctgtctcgtg tagggtgagt gaggctctgt ccccaggtgt 2100 
ccttggcgtt tgctcacttg agcttgctcc tgaatgtttg ctctttctat agccacagct 2160 
gcgccggttg cccattgcct gggtagatgg tgcaggcgca gtgctggtcc ccaagcctat 2220 
cttttctgat gctcggctct tcttggtcac ctctccgttc cattttgcta cggggacacg 2280 
ggactgcagg ctctcgcctc ccgcgtgcca ggcactgcag ccacagcttc aggtccgctt 2340 
gcctctgttg ggcctggctt gctcaccacg tgcccgccac atgcatgctg ccaatactcc 2400 
tctcccagct tgtctcatgc cgaggctgga ctctgggctg cctgtgtctg ctgccacgtg 2460 
ttgctggaga catcccagaa agggttctct gtgccctgaa ggaaagcaag tcaccccagc 2520 
cccctcactt gtcctgtttt ctcccaagct gcccctctgc ttggccccct tgggtgggtg 2S80 
gcaacgcttg tcaccttatt ctgggcacct gccgctcatt gcttaggctg ggctctgcct 2640 
ccagtcgccc cctcacatgg attgacgtcc agccacaggt tggagtgtct ctgtctgtct 2700 
cctgctctga gacccacgtg gagggccggt gtctccgcca gccttcgtca gacttccctc 2760 
ttgggtctta gttttgaatt tcactgattt acctctgacg tttctatctc tccattgtat 2820 
gctttttctt ggtttattct ttcattcctt ttctagcttc ttagtttagt catgcctttc 2880 
cctctaagtg ctgccttacc tgcaccctgt gttttgatgt gaagtaatct caacatcagc 2940 
cactttcaag tgttcttaaa atacttcaaa gtgttaatac ttcttttaag tattcttatt 3000 
ctgtgatttt tttctttgtg cacgctgtgt tttgacgtga aatcattttg atatcagtga 3060 
cttttaagta ttctttagct tattctgtga tttctttgag cagtgagtta tttgaacact 3120 
gtttatgttc aagatatgta gagtatcaag atacgtagag tattttaagt tatcatttta 3180 
ttattgattt ctaactcagt tgtgtagtgg tctgtataat accaattatt tgaagtttgc 3240 
ggagccttgc tttgtgatct agtgtgtgca tggtttccag aactgtccat tgtaaatttg 3300 
acatcctgtc aatagtgggc atgcatgttc actatatcca gcttattaag gtccagtgca 3 360 
aagcttctgt ctccttctag atgcatgaaa ttccaagaag gaggccatag tccctcacct 3420 
gggggatggg tctgttcatt tcttctcgtt tggtagcatt tatgtgaggc attgttaggt 3480 
gcatgcacgt ggtagaattt ttatcttcct gatgagtgaa tcttttggag acttctatgt 3540 
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ctctagtaat ccagcaaccc cccccccaaa ccgcccctag tactgccaca ccgggccccc 3600 
ttcgaccagc attctcctgc cgcgccCgcc ttctgccttt aacccacaca cacacataca 3660 
cctcctcccc tcttgagaca gagccccggc ccgtcgccca gggtgagcgc agcggcgcga 3720 
ccacaggcca gcgcaacccc caccttctgg cctgagccgc ccccccaccc cagccccccg 3780 
agcagccgga actgcagaca cgcaccgcta cacccggcta acccccaaac tttttctgga 3840 
gacagggtct cgccgtgttg cccaggccgg tcccaaactc ttggactcaa gggatccatc 3 900 
cacctcggct tcccaaagtg ccgaaccaca ggcacgagcc accacgcccg gcctaatttt 3960 
caacactttt acacccccat agtgcgggca tgccccgcta acagcatgta ggcgaacccc 4020 
caacccagcc cgacagccgc Cgcccaaccg gacaacccga CCCaCCCtca cccccccgcc 4O60 
accagagacc cgcctggtgc actctgattc tccacttgcc tgttgcatgc ccccgtcccc 4140 
tcgcccccca ccacctcttg ggctgccatg cgcgCCCccc gccgagtgtg cgccgaccct 4200 
cccgtcgcct cctggtcact gggcacttgc ccccaccccc ctttgcttag tgttaccccc 4260 
cgaccccccc accgCcgccg CCCgcCCtcg cccaccgaga cagtctcacc ctgtcaccca 4320 
ggctggagtg caacggcaca accccggccc actgcaacct ctgcctcctc ggttcaagca 43 80 
gctctcattc ctcaacctca tgagtagctg ggaccacagg cgcccaccac cacgcctggc 4440 
taacccccgc acccccagca gagataggct ttcaccacgt tggccaggct ggccccaaac 4 500 
tcccgacccc aagcgacccg cccgccttgg cctcccacag cgccgggacc acaggcgcaa 4S60 
gccaccgcgc ccggcatacc tcgacccccc aaaatgaagc ctgaaacact gccacccttg 4620 
ccctgagcaa taagacccct agcgtatttt agctctggcc accccccagc ccgtgtgctg 4680 
ctctccccgc tgacttagtt ccatctcagg catcctgaca cccccacaag ctaagcatta 4740 
ctaatattgt tttccgtgtt gagtgtttct gtagctttgc ccccgccctg cttttcctcc 4800 
tctgttcccc gtctgcctcc tgtctcaggc ccgccgtctg gggtcccctt ccttgtcctc 4860 
cgcgtggttc ccctgtcttg tcactgccgg taaaccccag ctttacctgt gctggcctcc 4920 
atggcatcta gcgacgtccg gggacctctg cttatgatgc acagatgaag atgtggagac 4 980 
ccacgaggag ggcggccacc ttggcccgtg agtgtctgga gcaccacgtg gccagcgttc 5040 
cctagccagt gagtgacagc aacgtccgct cggcccgggc ccagcctgga aaaccccagg 5100 
catgtcgggg tctggtggcc ccgcggtgtc gagtttgaaa tcgcgcaaac ctgcggtgcg 5160 
gcgccagctc tgacggtgct gcctggcggg ggagtgtctg cttcctccct tctgcttggg 5220 
aaccaggaca aaggatgagg ctccgagccg ttgtcgccca acaggagcat gacgtgagcc 5280 
acgcggataa ttttaaaatt cccaggccgg gcgcggcggc ccacgcctgt aaccccagca 5340 
cttcgggagg ccaaggcggg cggaccacga ggccaggagg ccgagaccac cctggccaac 54 00 
acgatgaaac cccacctgta ctaaaaacac aaaaatcagc cgggcgcggc ggcgggcgcc 5460 
tgcaacccca gccactcggg aggctgaggc aggagaactg cccgaacctg ggagctggaa 5520 
gctgcagcga gccgacaccg caccaccgca ccccagcccg gcaacacagc gagactccgt 5580 
cccaaaaaaa aaaaaaaaaa aaaaaaaaaa aaccctagca gccacactaa aaaagcaaaa 5640 
aagaaaaggc gaaaccaacg caataataga ccttaccgaa gcccagcacg tccacacccc 5700 
accattccag ggcgccaccg gtgggagcaC cacccacagg acatttgaca ccctccgagc 5760 
ctcgcctgcg ggatcccgcg cgcaggcccc gtgcgtggcc atcccggccc ggacccgccg 5820 
ggccccccac ggccaCggcC gctgtaccag atggcgcagg tccgggatga ggccgccagg 588 0 
cccccagtga gctggatgcg cagcgcccgg acggcgcacg cccgggatga ggccgccagg 5 940 
ccccgccgcg agccggacgc gcggcgcccg gacggtgcag gtcaggggtg aggcccccag 6000 
gcccccggcg agctggaggc acggagtccg gacgacgcag gcccggggtg aggccgccag 6 060 
gccccgccgc gagccggacg cgcggcgccc ggacggcgca ggtcaggggc gaggccccca 6120 
ggcccccggc aagccggagg caCggagCcc ggacgacgca ggtccggggc gaggccgcca 6180 
ggccccgccg tgagccggac gcgcggcgtc cggatggtgc aggcccgggg cgaggccacc 624 0 
aggccctgcg gcgagccggg tgtgcggcgc ctggacggtg caggtctgga gtgaggtcgc 6 3 00 
cagacggcgc cagaccatgc ggtgagccgg acacgcggtg cccggatggc gcaggtccgg 6360 
ggcgaggttg ccaggccccg ccgcgagccg gacgtggggc gcccggacgc tgcaggtccg 6420 
gcgcgaggtc accaggccct gccgcgagcc ggacgtgcgg tgtctggatg gcgcaggtcc 64 BO 
ggggcgaagg ccgccaggcc cccgcccgcg agccggacgc gcggtgtccg gatggtgcag 6540 
gcccggagcg aggccgccag gcccccggcg agccggacgt gcagCgtcca gacggcgcag 6600 
gcccggggcg aggccgccag accctgcggc gagccggacg cgcggtgtcc ggacggcgca 6660 
ggcccggagc gaggccgcca ggcccccggc gagccggacg cacggagccc ggacggcgcc 6720 
ggcccggggc gaggccgcca gaccccgccg cgagccggac gCgcggcgcc cggacggcac 6780 
aggtctggag cgaggccgcc agaccccgcc gcgagccgga caCgcggcgC ccggacggcg 6840 
caggccaggg gcgaggcccc caggcccccg gcgagccgga ggtacggagc ccggacgacg 6 900 
caggcccggg gtgaggccgc caggccccgc cgcgaaccgg acgCgcggcg cccggacggc 6 960 
gcaggcccgg ggcgtggtcg ccaggccccc ggcgagccgg aggtaCggag cccggacgac 7020 
gcaggcccgg ggcgaggccg ccaggccccg ccgtgagccg gacgcgcggc gtctggacgg 7080 
cgcaggcctg gggcgcggcc gccaggcccc cggcgagccg gaggcacgga gcccggacga 714 0 
cgcaggcccg gggcgaggcc gccaggcccc gccgcgagcc ggacgcgccg cacccggacg 7200 
gcgcagtccg gggcgaggcc gccaggcccc gccgcgagcc ggacgcgccg cacccggacg 7260 
gtgcaggccc ggggcgaggc caccaggccc cgcggcgagc cggctgcgcg gcgcccggcc 7320 
gccgcaggcc cggggcgagc ccgccaggcc ctcggcgagc cggacgcgcg gcgcccccgc 7380 
gcccggacgg cgcaggccca gggcgaggcc gccaggcccc tggtgggccg gacgcgccgc 744 0 



WO 99/33998 



PCT/EP98/08216 



9 / 18 



gtccggatgg tgcaggtctg gggtgaggtc gccaggccct tggtgagctg gatgtgcggt 7500 

gcccgcatgg tgcaggtctg gggtgaggtc gccaggccct tggtgggctg gatgtgcggt 7560 

gtccggatgg tgcaggtccg gcgtgaggtc gccaggccct gctgtgagct ggatgtgcgg 76 20 

tgtctggatg gtgcaggtcc ggggtgaggt agccaaggcc ttcggtgagc tggatgtggg 7680 

gtgtccggat ggtgcaggtc cggggtgagg tcgccaggcc ctgcggctag ctggatatgc 7740 

ggtgtccgga cggtgcaggt ccggggtgag gtcaccaggc cctgcggtta gctggatgtg 7800 

cggtgtctgg atggtgcagg tccggggtga ggtcgccagg ccctgctgtg agctggatgc 786 0 

gctgtatccg gatggtgcag gtccggggtg aggtcgccag gccctgcagt gagctggatg 7920 

tgctgtatcc ggatggtgca ggtctggcgt gaggtcgcca ggccctgcgg ttagctggat 7980 

atgcggtgtc ggatggtgca ggtccggggt gaggt caeca ggccctgcgg ttagctggat 804 0 

gtgcggtgtc cggatggtgc aggtctgggg tgaggtcgee aggccctgct gtgagctgga 8100 

tgtgctgtat ccggatggtg caggtceggg gtgaggtege caggccctgc ggtgagctgg 8160 

atgtgctgta tccggatggt gcaggtctgg cgtgaggtcg ccaggccctg cggtgagctg 8220 

gatgtgcagt gtacggatgg tgcaggtccg gggtgaggtc gccaggccct gcggtgggct 8280 

gtatgtgtgc tgtctggatg gtgcaggtcc ggggtgagtt cgccaggccc tgcggtgagc 8340 

tggatgtgtg gtgtctggat getgeaggtc cggggtgagt tcgccaggcc cteggtgage 8400 

tggatatgcg gtgtccccgt gtccgaatgg tgcaggtcca gggtgaggtc gccaggccct 8460 

tggtgggctg gatgtgccgt gtccggatgg tgcaggtctg gggtgaggtc gccaggccct 8520 

tggtgagctg gatgtgcggt gtccggatgg tgcaggtccg gggtgaggtc accaggccct 8580 

cggtgatccg gatgtggcat gtccttctcg tttaag 8616 

<210> 6 
<211> 2089 
<212> DNA 

<213> Homo sapiens 
<400> 6 

gtactgtatc cccacgccag gcctctgctt ctcgaagtcc cggaacacca gcccggcctc 60 

agcatgcgcc tgtctccact tgcctgtgct tccctggctg tgcagctctg ggctgggagc 120 

caggggcccc gtcacaggcc tggtccaagt ggattctgtg caaggctctg actgcctgga 180 

gctcacgttc tcttacctgt aaaatcagga gtttgegeca agtggtcCct agggtttgta 240 

aagcagaagg gatttaaatt agatggaaac actaccacca gcctccttgc ctttccctgg 300 

gatgtgggtc tgattctctc tctctttttt ttttctcttt tgagaeggag tctcactctg 360 

ttgcccaggc tggagtgcag eggcataate ttggctcact gcaacctcca cctcctgggt 420 

ttaagegatt caccagcctc agcctcctaa gtagctggga ttacaggcac ctgccaccac 48 0 

gcctggctaa cttttgtact tttaggagag aeggggttte accatgttgg ccaggctggt 54 0 

ctcgaactca tgacctcagg tgatccaccc accttggcct cccaaagtgc tgggtttaca 600 

ggctaageca ccgtgcccag cccccgattc tcttttaatt catgctgttc tgeatgaate 660 

ttcaatctat tggatttagg tcatgagagg ataaaacccc acccacttgg cgactcactg 720 

cagggagcac ctgtgcaggg agcacctggg gataggagag ttccaccatg agctaacttc 780 

taggtggctg catttgaatg gctgtgagat ettgtctgea atgttcggct gatgagagtg 84 0 

tgagattgtg acagattcaa gctggatttg catcagtgag ggaegggage gctggtctgg 900 

gagatgecag cctggctgag cccaggccat ggtattagct tctccgtgtc ccgcccaggc 960 

tgactgtgga gggctttagt cagaagatca gggcttcccc agctcccctg cacactcgag 1020 

cccctggggg gccttgtgac accccatgcc ccaaatcagg atgtctgcag agggagctgg 1080 

cagcagacct cgtcagaggt aacacagcct ctgggctggg gaccccgacg tggtgctggg 1140 

gccatttcct tgcatctggg ggagggtcag ggctttccct gtgggaacaa gttaatacac 1200 

aatgeacett acttagactt tacaegtatt taatggtgtg cgacccaaca tggtcatttg 1260 

accagtattt tggaaagaat ttaattgggg tgaccggaag gagcagacag acgtggtggt 13 20 

ccccaagatg ctccttgtca ctactgggac tgttgttctg cctggggggc ettggaggee 13 80 

cctcctcccc ggacagggta ccgtgccttt tctactctgc tgggcctgcg gcctgcggtc 1440 

agggcaccag ctccggagca cccgcggccc cagtgtccac ggagtgccag gctgtcagcc 1500 

acagatgccc aggtccaggt gtggccgctc cagcccccgt gcccccatgg gtggttttgg 1560 

gggaaaaggc caagggcaga ggtgtcagga gactggtggg ctcatgagag ctgattctgc 1620 

tccttggctg agctgccctg agcagcctct cccgccctct ccatctgaag ggatgtggct 1680 

ctttctacct gggggtcctg cctggggcca gcctcgggct accccagtgg ctgtaccaga 174 0 

gggacaggca tcctgtgtgg aggggcatgg gttcacgtgg ccccagatgc agectgggae 1800 

caggctccct ggtgctgatg gtgggacagt caccctgggg gttgaccgcc ggactgggcg 1860 

cccccagggt tgactatagg accaggtgtc caggcgccct gcaagtagag gggctctcag 1920 

aggegtctgg ctggcatggg tggacgtggc cccgggcatg gccttcagcg tgtgctgccg 1980 

tgggtgccct gagccctcac tgagtcggtg ggggcttgtg gcttcccgtg agcttccccc 204 0 

tagtctgttg tctggctgag caagcctcct gaggggctct etattgeag 2089 
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<2X0> 7 

<21X> 687 

<212> DNA 

<213> Homo sapiens 



<400> 7 

gtggctgtgc cctggtttaa cttccttttt 

gtatcagctt agatgaaggg cccggaggag 

cggcgccaac ccatttgtgc gcacagtgag 

cagcgtgggg gtgtaggggg agcccctggg 

cagccgggcc agggcctgga tgcagcacgg 

gtgcgcagcc tccgtgcgct tccgcttacg 

agcccaccgg gctctgagga tcctggacct 

ggctgcggcg gctgcggtga ccccgtcatc 

gtgtggcatg aggatcccgt gtgcaacaca 

cctgaggaag ctgggagggg ttccaggtcc 

gggctgcttc tcccctgggt ccccatggcg 
gactgtctcc catgctgtcc ccgccag 

<210> 8 

<211> 494 

<212> DNA 

<213> Homo sapiens 



aaacagaagt gcgtttgagc cccacacttg 60 
gggccacggg acacagccag ggccatggca 120 
gtggccgagg tgccggtgcc tccagaaaag 180 
gcagggacag gctctgagga ccacaagaag 24 0 
cccgaggtcc tggatccgtg tcctgctgtg 300 
gggcccgggg accaggccac gactgccagg 360 
tgccccacgg ctcctgcacc ccacccctgt 420 
tgaggagagt gtggggtgag gtggacagag 480 
catgcggcca ggaacccgtt tcaaacaggg 540 
cgggtctggg tggctgggga cactggggag 600 
gggtgggcac ttggccggat ccactttcct 660 

687 



<400> 8 

gtgggtgccg gggacccccg tgagcagccc 
gcacctcatg ttgggtggag gaggtactcc 
tgtcactgtt gaggacacac ctggcaccta 
catggggccg actgtgcacc ctgactgccc 
gattccagtt tccgtcagag aaggaaccgc 
gcaccccagt cctgagccag gggtctcctg 
ccctgccctt ggggtctgga gtggtggggg 
caggccctga gggcagaggt gatgtctgag 
ctccactcac acag 



tgctggacct tgggagtggc tgcctgattg 60 
tgggtgggcc gcagggagtg caggtgaccc 120 
gggtggaggc cttcagcctt tcctgcagca 180 
gggctcctat tcccaaggag ggtcccactg 240 
aacggctcag ccaccaggcc ccggtgcctt 300 
tcctgaggct cagagagggg acacagcccg 360 
tcagagagag agtgggggac accgccaggc 420 
tttctgcgtg gccactgtca gtctcctcgc 480 

494 



c210> 9 

<211> 865 

<212> DNA 

<213> Homo sapiens 



<400> 9 

gtaaggttca cgtgtgatag tcgtgtccag 
agaatgcagt cgtgtctgtg atgcgtttct 
ctgtgatatg cgtgtgtggc acgtgtgtgt 
tgtggtgtgt gtgtgtgtgg cacgtgtgtg 
tgtgtgtgtc tgtgacacgt gcatgttcat 
tttgtggtgt gtgtgtgcat gtgtccgtga 
ggccccttgg ccttactcct tcctcctcca 
tcgggtgctg gtttggggag ctccacattc 
gtcctgtcac agggctgggc cttggagact 
gccggtggta ccttcctgga cccctggcac 
tccatgagat ataggaaggc tgattcaggc 
cggccggggg ccttggggct cggcaggggt 
agtggtcacg agcacgctgg aggggtaagc 
ggtgaagaag tatccctgga gcttcggtct 
acctctttct ctgacttctt gagct 



gatgtgtgtc tctgggatat gaatgtgtct 60 
gtggtggagg tacttccatg atttacacat 120 
cgtggtgcat gtatctgtgg cgtgcatatt 180 
tccatggtgt gtgtgcctgt ggtgtgcatg 240 
gctgtgtgct gcatgtctgt gatgtgccta 300 
catatgcgtg tctatggcat gggtgtgtgt 360 
ggcatggtcc gcaccattgt cctcacgctc 420 
agggtcctca cttctagcat gggtgcccct 480 
gtaagccagg tttgagagga gagtagggat 540 
ccccaggacc ccagtctggc ctatgccggc 600 
ctcgctcccc gggacacact cctcccagag 660 
gaaaggggcc ctgggcttgg gttcccaccc 720 
cctcaaagtc gtgccaggcc ggggtgcaga 780 
ggggagaggc acatgtggaa acccacaagg 840 

865 



<210> 10 

<211> 3782 

<212> DNA 

<213> Homo sapiens 



<400> 10 

tgtgggattg gttttcacgt gtgggatagg tggggatctg tgggattggt ttttatgagt 60 
ggggtaacac agagttcaag gcgagctttc ttcctgtagt gggtctgcag gtgctccaac 120 
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agctttattg aggagaccat atcttccttt gaactatggt cgggtttata gtaagccagg 180 
ggtgcggagg cctcccctgg gctccctgtt ctgtttcttc cactctgggg tcgtgtggtg 240 
cctgctgtgg tgtgtggccg gtgggcaggg cttccaggcc tccttgtgtt cactggcctg 3 00 
gatgtggccc tggctacgct ccgtccttgg aattcccctg cgagttggag gctttctttc 360 
tttctttttt tctttctttt tttttttttt tgataacaga gtctcgctct tttttgccca 420 
ggctggagtg gtttggcgtg accttggctc accgcaacct gtgcttcctg agttcaagca 480 
attctcttgc ctcagcctcc caagtagctg gaattatagg cgcccaccac catgctgact 540 
aatttttgta attttagtag agacgaggtt tctccatgtt ggccaggctg gtctcgaact 600 
cctgacctca ggtgatcctc ccacctcggc ctcccaaagt gctgggatga caggtgtgaa 660 
ccgccgcgcc cggccgagac tcgcttcctg cagcttccgt gagatctgca gcgatagctg 720 
cctgcagcct tggtgctgac aacctccgtt ttccttctcc aggtctcgct aggggtcttt 780 
ccatttcatg actctcttca cagaagagtt tcacgtgtgc tgatttcccg gctgtttcct 840 
gcgtaattgg tgtctgctgt tcatcgatgg cctccttcca tttcctttag gctttgttta 900 
ttgttgtttt tccggctcct tgaaggaaaa gtttcgatta tggatgtttg aactttcttt 960 
cctaaacaag catctgaagt tgccgttttc cctctaaagc agggatcccg aggcccctgg 1020 
ctgtggagtg gcaccggtct ggggcctgtt aggaacccgg cgcacagcgg gaggctaggt 1080 
ggggtgtggg gagccagcgt tcccgcctga gccccgcccc tctcagatca gcagtggcat 1140 
gcggtgctca gaggcgcaca caccctactg agaactgtgc gtgagagggg tctagattct 1200 
gtgctcctta tgggaatcta acgcctgatg acctgaggcg gaaccgtttg ctcccaaaac 1260 
catccccctc cccactgctg tcctgtggaa aaatcgtctt ccacgaaacc agtccctggc 1320 
accacaacgg ttggggaccc tgtgctaaag acctgctcca gcagcctctc gtcagcgttg 13 80 
atatattggc ttctccgtgt tgagtccaga ataattacgg atttctgtga tgctttccgc 144 0 
cgacctcaga cccatgggct acttgtgggc gtgttgcctg ctcctgggtt gggaagggtg 1500 
caggccccac gtaccttcct gtcactgcct tccaggttgg ctcccagggt tgaatcgtac 1560 
tcgatgtggc tttagcccac ggccctgccg ccagctcctg ggggctgggg aacacgctga 1620 
agcacagagt caccgcgcgc gtctcttgat gcctcacaag ctcgaggcct cctgtgtccg 1680 
tgttagtgtg cgtcacgtgc ctgcccacat cctgtcttgg ggacgcaggg gcttagcagg 174 0 
tcccgtagta aacgacaagc gtcctggggg agtctgcaga ataggaggtg ggggtgccgg 1800 
tctctctccc gcgtcctcag actcttctcc tgcctgtgct gtggctgcac ctgcatccct 1860 
gcaatccctc cagcactggg ctggagaggc ccgggagctc gagtgccact tgtgccacgt 1920 
gaccgcggac ggcagccggt cacgggggtc tgatgtgtgg tgactgtgga tggcggttgg 1980 
ccacaggggt ctgatgtgtg gtgactgtgg atggcggtcg cggggtccga tgcggtgact 2040 
gcggatggcg gtcgtggggt ctgatgtgtg gtgactgtgg atggcggtcg tggggtctga 2100 
tgtggtgact gtggatggcg gtcgtggggt ctgatgtggt gactgtggat ggcggtcgtg 2160 
gggtctgatg tggtgactgt ggatggcagt cgtggggtct gatgtgtggt gactgtggat 2220 
ggcggtcgtg gggtctgatg tggtgactgt ggatggcagt cgtggggtct gatgtgtggt 2290 
gactgtggat ggcggtcgtg gggtctgatg tgtggtgact gtggatggcg gtcgtggggt 2340 
ctgatgtgtg gtgactgtgg atggcggtcg tggggtctga tgtgtggtga ctgtggatgg 2400 
cggtcgtggg gtctgatgtg gtgactgtgg atggcggtcg tggggtctga tgtgtggtga 2460 
ctgtggatgg tgatcggtca caggggtctg atgtgtggtg actgtggatg gcggtcgtgg 2520 
ggtctgatgt gtggtgactg tggatggtga tcggtcacag gggtctgatg tgtggtgact 2580 
gtggatggcg gtcgtggggt ctgatgtgtg gtgactgtgg atggcggttg gtcccggggg 2640 
tctgatgtgt ggtgactgtg gatggcgatc ggtcacaggg gtctgatgtg tggtgactgt 2700 
ggatggcggt cgtggggtct gatgtgtggt gactgtggat ggcggtcgtg gggtctgatg 2760 
tgtggtgact gtggatggcg gtcgtggggt ctgatgtggt gactgtggat ggcggtcgtg 2820 
gggtctgatg tggtgactgt ggatggcggt cgtggggtct gatgtgtggt gactgtggat 2880 
ggcggttggt cccgggggtc tgatgtgtgg tgactgtgga tggcggtcgt ggggtctgat 2940 
gtggtgactg tggatggcag tcgtggggtc tgatgtgtgg tgactgtgga tggcggtcgt 3000 
ggggtctgat gtgtggtgac tgtggatggc ggtcgtgggg tctgatgtgt ggtgactgtg 3060 
gatggcggtc gtggggtctg atgtgtggtg actgtggatg gcggtcgtgg ggtctgatgt 3120 
ggtgactgtg gatggcggtc gtggggtctg atgtgtggtg actgtggatg gtgatcggtc 3180 
acaggggtct gatgtgtggt gactgtggat ggcggtcgtg gggtctgatg tgtggtgact 324 0 
gtggatggcg gtcgtggggt ctgatgtggt gactgtggat ggcggtcgtg gggtctgatg 3300 
tgtggtgact gtggatggcg gtcgtagggt ctgatgtgtg gtgactgtgg atggcagtcg 3 3 60 
gtcacagggg tctgatgtgt ggtgactgtg gatggcggtc gtggggtctg atgtgtggtg 3420 
actgtggatg gcggtcgtgg ggtctgatgt gtggtgactg tggatggcgg tcgtggggtc 3480 
tgatgtgtgg tgactgtgga tggcggtcgt ggggtctgat gtggtgactg tggatggtga 3540 
tcggtcacag gggtctgatg tgtggtagct gcaggtggag tcccaggtgt gtctgtagct 3600 
actttgcgtc ctcggccccc cggcccccgt ttcccaaaca gaagcttccc aggcgctctc 3660 
tgggcttcat cccgccatcg ggcttggccg caggtccaca cgtcctgatc ggaagaaaca 3720 
agtgcccagc tctggccggg gcaggccaca tttgtggctc atgccctctc ctctgccggc 3780 
ag 3782 
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<210> 11 
<211> 980 
<212> DNA 

<213> Homo sapiens 

<400> 11 

gtctgggcac cgccctgcag ggttgggcac ggactcccag cagtgggtcc tcccctgggc 60 
aatcactggg cccacgaccg gacagactgt tggccctggg gggcagtggg gggaatgagc 120 
tgtgatgggg gcatgatgag ctgcgtgcct tggcgaaatc tgagctgggc cacgccaggc 180 
tgcgacagct gctgcattca ggcacctgct cacgtttgac tgcgcggcct ctctccagtc 24 0 
ccgcagtgcc tttgttcatg acctgctaaa tgccttctct gccagtttcg atcttgaggc 300 
caaaggaaag gtgtccccct cctttaggag ggcaggccat gtttgagccg cgtcctgccc 3 60 
agctggcccc tcagtgctgg gtctgaggcc aaaggaaacg tgtccccctt cttaggagga 420 
cgggccgcgt ctgagccacg ccccgctgag cgggcctctc agtgctgggt ctgtccacgt 480 
ggccctgtgg ccctttgcag atgtggtctg tccacgtggc cctgtggctc tttgcagatg 540 
cctgtcagca cttgcccggc tctaggggac agtcgtgtcc accgcatgag gctcagagac 600 
ctctgggcga atttccttgg ctcccagggt gggggtggag gcggcctggg ctgctgggac 660 
ccagaccctg cgcccggcag ctgggcagca actcctggat cacatatgcc atccgggcca 720 
cggtgggctg tgtgggtgtg agcccagctg gacccacagg tggcccagag gagacgttct 780 
gtgtcacaca ctctgcctaa gcccatgtgt gtctgcagag actcggcccg gccagcccac 840 
gatggccctg cattccagcc cagccccgca cttcatcaca aacactgacc ccaaaaggga 900 
cggagggtct tggccacgtg gtcctgcctg tcccagcacc caccggctca ctcccatgtg 960 
tctcccgtct gctttcgcag 980 

<210> 12 
<211> 2485 
<212> DNA 

<213> Homo sapiens 
<400> 12 

gcgagtcagg tggccaggtg ccattgccct gcgggtggct gggcgggctg gcagggcttc 60 
tgctcacctc tctcctgccc cttccccact gnccttctgc ccggggccac cagagcctcc 120 
tttcctggcc cccgccccct ccggcccctg ggctgcaggc tcccgaggcc ccggaaacat 180 
ggcccggctt gcggcagccg gagcggagca ggtgccacac gaggcctgga aatggcaagc 24 0 
ggggcgtgga gctgctcccg cgrggaggac gaggggcggg gggcgtgtct gggtcaggtg 3 00 
tgcgccgagc gcttgagccc gcagcttgtc agctccaagt tactactgac gccggacacc 3 60 
cggcccccac acgcccgtac ctctccctcc cgatacaaaa ggattttatc cgaccctcat 420 
ccctgtccct gtcgtgtgac ccccgcgagg gcgcgggctc ttccctctgt gactagattt 480 
cccatctgga aagtgcgggg ttgaccgtgt agtttgctcc cctcgggggg cctgtggcgg 54 0 
ccatggggca ggcggcctgg gagagctgcc gtcacacagc cactgggtga gccacactca 600 
cggtggtaga gccacagcgc ctggtgccac atcacgccct ctggatttta agtaaaacca 660 
cacacccccc ggcaggcatc tgcctgcgac cctgtgcgtg cctggggaga gtggtagcac 720 
ggaggaaatt cgtgcacact caaggtcatc agcaaggtca tccgcagtca ggtggaacgt 780 
ggaggcctcc ctctgggatc gtccccagcg gataaaggac tgtgcacagc ttcggaagct 840 
tctatttaaa aatataacta ttaattattg cattataagt aatcactaat ggtatcagca 900 
attataatat ttattaaagt ataattagaa acaccaagca gtacacacgt cctggaaaaa 960 
cacaaattgc acatggcagc agagtgaatt ttggccgagg gacacgtgcg cacatgtgtg 1020 
taagcggccc ccaggcccac agaattcgct gacaaagcca cccccccaga gaagccacca 1080 
cgggcctcct tcgtggtcgt gaatcttatt aagatggatc aagtcacgta ccgtccacgt 1140 
gtggcagggc tttggggaat gtgaggtgat gactgcgtcc tcatgccctg acagacagga 1200 
ggtgactgtg tctgtcctgt ccccaggaca cggacaggcc cgaagcccta gtccccatcg 1260 
tggtccagtt tggcctctga ataaaaacgt cctcaaaacc tgtcgcccca aaaaccaaga 1320 
acagagagag tttcccatcc catgtgctca caggggcgca tctgcttgcg ttgactcgct 13 80 
gggctggccg gacccctaga gttggtgcgt gtgcttctgt gcaaaaagtg cagtcctctt 1440 
gcccatcact gtgatatctg caccagcaag gaaagcccct tttcttttct ttcttttttt 1500 
ctttttgaga cggaacgtca ctgttgtctg cctgggctcg agtgcagtgg cgcgacctca 1560 
actcactgca acctccgcct cccgggctcc agcatttctc ctgcctcagc ctcccgagca 1620 
gctgagatta caggcaccca ccccctgcgc ctggctaatt tttgtatttt tagtagagag 1680 
gggtctttgc catgttggcc aggctggtct cgaacccccg acctcaggtg atccacccac 174 0 
ctcggcctcc caaagtgctg ggatcacagg tgtgagccat cacgcccagc cggaaagcct 1800 
cttcctaagg tgaccaccta tagcgcttcc cgaaaataac aggtcttgtt tttgcagtag 1860 
gctgcaagcg cctcttagca acaggagtgg cgtcctgtgg gctctgggga tggctgaggg 1920 
ccgcgtggca gccatgcctt ctgtgtgcac ctttaggttc cacggggcta ttctgctctc 1980 
actgtttgtc tgaaaacgca cccttggcat ccttgtttgg agagtttctg cttctcgttg 2040 
gtcatgctga aactaggggc aaggttgtat ccgctggcgc gcagcggcta catgtagggt 2100 
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catgagtctt tcaccgtgga caaacccctt 
tcattccggg ccaagtgtct ggttctgtga 
aaagaaaacc ttgatgattc agagcaagga 
agccgcccca gtgcacggcg agagtgggga 
ggtatgtttc tgaggtgttt gccggctgaa 
cctgtgcctg tgtgtggctc ggcttgagtg 
tctcacctgc gtcctcccgc cccag 



gaaaaaaaaa aaaggagtcc ggttaagcat 2 ISO 
ataaactcta agatttaaga aaccttaatg 2220 
tgtggtcaca cctgtggctg gatctgttcc 2280 
gcagggatcg tttgttcaga ggccccatct 234 0 
tggtagacgt gtcgtttgtg tgtatgaggt 2400 
tacgcatgtc cagcacacgc cctgcccgtc 2460 

2485 



<210> 13 
<211> 1984 
<212> DNA 

<213> Homo sapiens 



<400> 13 

gtgaggcctc ctcttcccca ggggggcttg 
agtgttaata ttcctggtgc cctggagacc 
ggttgcagcc ccctcttggt atgaagccgc 
gggccccacg caggctctgt ccagcggcca 
gagggccgcc gccctgcatg atgagcatgt 
ctgtcacgtc acccaggtcc cgttagggtc 
gccccacatc tcccagcagg ccctcgacag 
ttgcccatcc cacttgcatg gggtctacac 
aacctaatgt ggttcaactc agctggcttt 
tactttaagt tctagggtac atgtgcacga 
gccatgttgg tgtgctgcac ccattaactc 
tatccctccc cactcccccc atcccacgac 
tgtccaagcg ttctcattgt tcagttccca 
ctctttccct gcaatagttt gcccagagtg 
aaggacatga actcatcctt ttttatgacc 
attttcttaa tccagtctat catcgatgga 
gtgaatagtg ccgcaataaa catacgtgtg 
tcctttgggt atatacccag taatgggatg 
tccttgagga atcaccacac tgtcttccac 
cagtgtaaaa gtgttctggt gctggagagg 
tagtatcact gaacaagcag acagttagtg 
cagccatttc cctcgaagac cccgggtttt 
attatagcat gtacagtgga tcaaggttct 
ataagtttat gtaacagaaa caaaaattcc 
ggaaagtgtc ctcgagctgg cggcacactg 
ccatggtcat ggggcgctgg gcttgggcct 
cctgtggata ggacctgggt ctcggatcat 
gggcaccacg tggctcagag ggggcgaggc 
ttatttttcc ctaagagtct gagaagtggg 
gctggcacag aattgcacaa gccgatggta 
tgctgtagca gttaactgta gagagctcgt 
aaccgctttg gagaatgtta ctttatttat 
ccgtagacag atactacgta aaaagtgtaa 
ttag 

<210> 14 

<211> 1871 

<212> DNA 

<213> Homo sapiens 



ggtgggggct gacttgcttt tgatgcattc 60 
acgactgctc tgtcttgagg aaccagacaa 120 
acgggagggg ttgcacagcc tgaggactgc 180 
tgtccagagg cctcagggcc cagcaggcgg 240 
gaattcaaca ccgaggaagc acaccagctt 3 00 
cttggggaga tggggctggt gcagcctgag 360 
gtggcccgga ccgggcgcct ccccagccca 420 
ccaaggacgc acacacctaa atatcgtgcc 480 
tattgacagc agttactttt tctcttctaa 540 
cgtgcaggct agttacatat gtatacatgt 6 00 
atcatttaca ccaggcatat ctcctaatgc 660 
aggccctggt gtgtgatgtt ccccaccctg 720 
cctgtgagtg agaacatgtg gtgtttggtt 780 
atggtttcca gccccgtcca tgtccctaca 840 
gcatagtatt ccgtggtgta tatgtgccac 900 
catttgggtt ggctgcaagt cttcgctact 960 
catgtgtctt tatagcagca tgatttataa 1020 
gctgggtcaa atggtatttc tagttctaga 1080 
aacggttgaa ctagtttaca cccccaccaa 1140 
atgtggacag cagttatttt tttatgaaaa 1200 
aaggatgcgt caggaagcct gcaggccaca 1260 
tcccgtgcac cttttgaaac tctagcccca 1320 
tcttcattaa ggttcaagtt ctagattgaa 1380 
ttgtacacac aacttgctct gggatttgga 14 4 0 
gtcagccetc tgggacagga tacctctggc 1S00 
gagggtcaca cagtgcacca tgcccagctt 1560 
gctgaggacc acagctgcca tgctggtaaa 1620 
tcccagcccc agctctccta ccgtcttcag 1680 
gccgcgcctg acggccttcg ttcgtcttca 1740 
aacactgagt acttataatg aatgaggaat 1800 
ccgtcggaaa gaaattcaag tttttcactt 1860 
ggctgtgtaa attgtttgac attcagtccc 1920 
agttaacctt gctgtgtatt ttcccttatt 1980 

1984 



<400> 14 

gtgaggcccg tgccgtgtgt ctgtggggac 
cccccgtgtc ctgcccctgg caccgcagcg 
gtgctggatc cgcaagagca gaggcgcttg 
caccttcggg agggagtggg taccgtgcag 
acacacgtgg tgagtgcagg cggtgacctg 
ggcggctcct ggggccccag tgagaccccc 
ggcggcagcc tcccccccag ggtgcacctg 
gctggcccac agcgttcgct gcggtcacgt 
agaatttgga tttgctgagt gctgctgcct 
cagagttgat tcttgtgaat caaaccaaaa 



ctccacagcc tgtgggcttt gcagttgagc 60 
ttgtctctgc caagtcctcc ctctctgccg 120 
gccgtgcacc caggcctggg ggcgcagggg 180 
gccctggtcc cgcagagacg cacccaggtt 24 0 
gctcccgctg ctctttggaa agtcaagagt 3 00 
aggagccgtg cacagggcct gcagggccga 360 
agcctgcgga gagcaggagc tgctgagtga 420 
tcccgcgtgg ggttgtttgg gatcggtggg 480 
tgaaccacgg agatggctag gagcgggttt 540 
tcaggcacag gggacctggc ctcagcacag 600 
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gggattgtcc aatgtggtcc ccctcaaggg cgccccacag agccggtggg cttgttttaa 660 

agtgcgattt gacgagggac gagaaacctt gaaagctgta aagggaaccc tcagaaaatg 720 

tggccgccag gggtggtttc aggtgctttg ctgggctgtg tttgtgaaaa cccatttgga 780 

cccgcccccc aagtccaccc tccaggtcca ccctccaggg ccgccctggg ctgggggtat 840 

gcctggcgtt ccttgtgccg cagcccggag cacagcaggc cgtgcacatt taaatccact 900 

aagattcact cggggggagc ccaggtccca agcaactgag ggctcaggag tcctgaggct 960 

gctgagggga cagagcagac ggggaacgct gcttctgtgt ggcaagctcc tgagggtgct 1020 

ggccagggag gtggctcaga gtgtatgttg gggtcccacc gggggcagaa ctccgtctct 1080 

gatgagtcgg cagccatgta acaggaaggg gtggccacag ggagctggga atgcaccagg 114 0 

ggagctgcgc agctggccga ggtcccaggg ccaggccaca ggaagggcag ggggacgccc 1200 

ggggccacag cagaggccgc aggaagggaa ggggatgccc aggccagagc agaggccacc 1260 

gggcacaggg gggctccccg agctgggtga gcgaggctca tgactcggcg agggaacctc 13 20 

cttgacgtga agctgacgac tggtgttgcc cagctcacag cccagccagg tcccgcgcct 13 80 

gagcaggaac tcagaaccct cccctttgtc taaagcacag cagatgcctt cagggcatct 144 0 

aggagaaaac aggcaaagcc gttgagaaac gtcttaaaag aaggtgggat ggtggcaatt 1500 

tcttgtccag attttagtct gccccggacc acagatgagt ctataacggg attgtggtgt 1S60 

tgccatgggg acacatgaga tggaccatca cagaggccac tggggctgca cctcccatct 1620 

gagtcctggc tgtcccgggt ccaggccagg ttcttgcatg ctcacctacc tgtcctgccc 1680 

gggagacagg gaaagcaccc cgaagtctgg agcagggctg ggcccaggct cctcagagct 1740 

cctgccaggc ccagcaccct gctccaaatc accacttctc tggggttttc caaagcattt 1800 

aacaagggtg tcaggttacc tcctgggtga cggccccgca tcctggggct gacattgccc 186 0 

ctctgcctta g 1871 

<210> IS 

<211> 3801 

<212> DNA 

<213> Homo sapiens 

<400> 15 

gtgagcgcac ctggccggaa gcggagcctg tgcccggctg gggcaggtgc tgctgcaggg 60 
ccgttgcgtc cacctctgct tccgtgtggg gcaggcgact gccaatccca aagggtcaga 120 
ggccacaggg tgcccctcgt cccatctggg gctgagcaga aatgcatctt tctgtgggag 180 
tgagggtgct cacaacggga gcagttttct gtgctatttt ggtaaaagga aacggtgcac 240 
cagacctggg tgcactgagg tgtcttcaga aagcagcctg gatccgaacc caagacgccc 300 
gggccctgct gggcgtgagt ctctcaaacc cgaacacagg ggccctgctg ggcatgagtc 360 
cctctgaacc cgagaccccg gggccctgct gggcgtgagt ctctccgaac ccagagactt 420 
cagggccctt ttgggcgtga gtctctccgc tgtgagcccc acactccaag gctcatccac 480 
agtctacagg atgccatgag ttcatgatca cgtgtgaccc atcaggggac agggccatgg 54 0 
tgtggggggg gtctctacaa aattctgggg tcttgtttcc ccagagcccg agagctcaag 600 
gccccgtctc aggctcagac acaaatgaat tgaagatgga cacagatgca gaaatctgtg 660 
ctgtctcttt tatgaataaa aagtatcaac attccaggca gggcaaggtg gctcacacct 72 0 
ataatcccag cactttggga ggccgaggtg ggtggatcac ttgaggccag gagtttgagg 780 
ccaacctaac caacatagtg aaattccatt tctacttaaa aaatacaaaa attagcctgg 84 0 
cctggtggca cacgcctgta gtccccgcta tgcgggaggc tgaggcagga gaatcatttg 900 
aacccaggag gcagaggttg cagtgagccg agatcacacc actgcactcc agcctgggca 960 
acagagtgag acttcatctt aaaaaaaaaa aaaaaagtat cagcattcca aaaccatagt 1020 
ggacaggtgt ttttttattc tgtccttcga taatatttac tggtgctgtg ctagaggccg 1080 
gaactggggg tgccttcctc tgaaaggcac accttcatgg gaagagaaat aagtggtgaa 1140 
tggttgttaa accagaggtt taaactgggg tcctgtcgtt ctgagttaac agtccagatc 1200 
tggacttcgc ctctttccag aatgctccct ggggtttgct tcatggggga gcagcaggtg 1260 
tggacaccct cgtgatgggg gagcagcagg tgcagacgcc ctcatgatgg gggagtggca 1320 
ggtgcagaca cccttgtgca tggtgcccag catgtccctg ttgcagctcc ctccccacaa 1380 
ggatgccggt ctcctgtgct ccccacagtc cctgcttccc tctcacagcc ttacctggtc 1440 
ctggcctcca ctggctttgt ctgcatgatt tccacatttc ctgggctccc agcacctctt 1500 
cgcctctccc aggcacctct gcagtgctgg ccataccagt cagctgtgaa ctgcccactg 1560 
cttattttgc cccccatgaa atgtattttt taggacaggc acccctggtt ccagcctctg 1620 
gcacagcatc agtgaatgtt attgaaggac aaaggacaga caaacaaatc aggaaaatgg 16 80 
gttctctcta aacacattgc aaagccacag aggctagtgc aggatgggtg ggcatcaggt 1740 
catcagatgt gggtccaatg ccagaatatt ctgtgctccc aaaggccact tggtcagagt 1800 
gtgtgcttgc agaggtggct ctaaaagctc agcagtggag gcagtggttc gccatactca 1860 
gggtgaactc acatcctctg tgtctgaagt atacagcaga ggcttgaagg gcatctggga 1920 
gaagaaaaca ggcaaaatga ttaagaaaag tgaaaaagga aaagtggtaa gatgggaatt 1980 
ttcttgtcca gattttagtc tcccaaacca cagctcagat ggtagaatgt ggtcagaact 2040 
gatggacaga acaatagaac aaaacggaag ccctatctct cagaaacgtg tgttaatgtg 2100 
gtatgtggca cagctgatgg aaaagagagt gtgtgtgtaa tttttttttc tgagaaaact 2160 
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gactggaagc aaataagttg tgtctttaca 
aggagacaca tgcaaacaac accagcaaca 
aggcgaacgt tccctggttt ggtgttgggg 
tgaggcaacg ggcattgctc tcactgcaga 
acggccattc cccggagcgt ttgtgcacgt 
cacattcatc ctctcacttt gttctcctaa 
aggggagcag ccgcccttgg tcacccagct 
ctcctgctcc ggggcccttg ctccgcccga 
agggtgagcc ggagcccaag gtcgtgttgg 
gatgcacact tgggaaggtc ctaccagcag 
gagacccatc cctcaaagaa acgcacgtga 
atgctggctc cttttctggg ctcgccaaga 
acctttctgg aaagcagctt gtttgcatgg 
taattccact cccgaagtga ccagacacta 
ccaggcaggg ggacttgcca cagcaagtca 
tattatgcat cacaaaactt gctctgccat 
gtttaatggc acaaaacgtt tatttcaatg 
cacaccccag gagcctgccg tgaatgtcat 
gggcagtgag tggtggtgag gccctggagg 
ctggagacac catgtgtgcc acgtgcactc 
gctcttccac ccctgagatt caaacacagc 
ccacaaaaaa cctgagtcac acctgtgttc 
acagtttatt atgtgtcttt ggctgagtta 
tgcacaaaca cggccgtgcg aggtctggat 
gagtttggtc atgcagagcc tggatggcat 
cagccccctc gggctgcagc gcatgcccca 
aggctctttg gagcaagctt tgcaggaggg 
acattccccc ctgtgtctca g 



gcacatacca gagcagattc caggtagaag 2220 
gaaataaaac aaaagaccca aagggaaggg 2280 
aaggacacac agggaggcgg acgaaaccag 234 0 
gaaactcagc ttgcctgagc cacagcgaaa 2400 
gatttattta aggcgccctg tgaggccccg 24 60 
ccacccgaga ggtagaggag gaaaggctcc 2520 
ggcaaagggc atgcatgatt gcagcccggc 2580 
ggaccccaca caagtcagac ccataggctc 264 0 
ggatggctgt gaaagaagaa atggacgtct 2700 
cgtcaaagaa atgcacgtga aactgacagc 2760 
aactgatggc gagacccgtc cccatccctc 2820 
gccagcacca ggccgaggca agccggaaag 2880 
aagcccccac aatgtcctgt gtcctcccag 2940 
ccacgggccc tacttaccac tcccagtgtt 3000 
cgaacctgcc caaacacagg gctaaggaga 3060 
taaacatttt tcaaagaatt tttgaagaat 3120 
tagcagtgtt caaagctgga tgtaaaagaa 3180 
gcgcgctcat ctttggacat ggacatacat 3240 
acatcggtgg gatgcctcca tcctgcccct 3300 
accggagccc tgtttagctg gcgccacccg 3360 
gagattcccc acgcccaact cagtgctccc 3420 
actcgaggga cgcccgggag ccagggctcc 34 80 
tgtgcagacc ccatcagggc agatgatgag 3540 
acactcaaca tcactagcca ggtcctggtg 3600 
gtagcatttg gagcccatgg agtgagcacc 3660 
ggcaggacaa ggaagcggga ggaaggcagg 3720 
ggctgggtgt ggggcaggca cctgtgtctg 3780 

3801 



<210> 16 

<211> 880 

<=212> DNA 

<213> Homo sapiens 



<400> 16 

gtgagcaggc tgatggtcag cacagagttc 
gtgtgtgtgt gtgcgcgcgt gcctgcaagg 
acatgtacgc atatacacgt gagcacatac 
cagtgtgtgc acaggcgcgc aagggcacaa 
tgcatgtgtg ttcgtgcaca gtcgtgtggg 
gcagcgtgag tagcatgcgt gcacacaaca 
caggtcctca gcaccagtgc cactccttac 
gctgaggccc tgaagctgca gccccgaggg 
ccccctcctg tgggcttctg tgtccactcc 
accccccccc tcccgtgggc acccgcgtcc 
cctcccctct ctgtgggcat ttgcgtccac 
gagcctcggg ggcaggcaga tgacacagag 
ccgggtgagg gccaggccgg atttcactgg 
ctctttcttg ttccatctga atggatgata 
gaggtttcta ccgcttctca ctctttcttg 



agagtccagg aggtgtgtgc gcaagtacgt 60 
ctgatggtga ctggctgcac gtaagagtgc 120 
acgtgtgcat gtgtgtacat gaaggcatgg 180 
gtgtgtgcac acgcgaatgc acacccgaca 24 0 
cattcacgcg aggcgcacgc gtgtgggtgt 300 
tgcatcgagg ggtcctcgtg ttcaccccgc 3 60 
aggatgagac ggggtcccag gccttggtgg 4 20 
cattgtccca cctgggcatc cgcgtccact 480 
ccctctcctg tgggcattta catccactcc 540 
actccccctc tctgtgggca tctgcgtcca 600 
cccctctcct ggtcccttcc tgtcttggcc 660 
tcttgactcg cccagggcgg ttcgcagctg 720 
gaagagggat agtttcttgt caaaatgttc 780 
aagcaaaaag caaaaaccta aaatcccaga 840 
gcgactctag 880 



<210> 17 

<211> 3186 

<212> DNA 

<213> Homo sapiens 

<400> 17 

gtgagccgcc accaaggggt gcaggcccag 

tctgacccgg ggcttcacct tggaactcct 

ttcagtggtg ctgctgcctg tgcacagttc 

tctccatctc cgggcagtgg taggagccgg 

gcactggccg tgggacgtca tggaggccat 

atgcctacgg ggagccttag cagaggaggc 

tcagatgccc ggaggatttg gggtctcagc 
tcgctggccc cacccccggg aaggcgcagc 



cctccaggga ccctccgcgc tctgcccacc 60 
gggttctagg ggcaaggaat gtcttacgtt 120 
cgttcgcgtg gctctgtgca aagcacctgt 180 
tgtggcccca ggtgtcccca ctgtgcctgt 240 
cccagggcag caggggcatg gggtaaagag 3 00 
tgggaaggtg tctgaacagt agatgggaga 360 
aaagagggcc gaggtgggtg caggtgaggg 42 0 
agagctgtgg ctccccacac agcccggcca 4 80 
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gcacctgtgc tctgggcatg gctgtgctcc 
ggtgcccctg ccaagaatcg acaactttat 
acagggccag cttctgcctg gagtcagggc 
aaagggcagt cgggcaccac aggcccgggc 
ggagctgaat gccaggaggc cgaagccctc 
atttgtgtta cccagggccg aggctgcgcg 
gtcgtcgtct atcgtggaaa cccagcaagg 
gtaccatgaa aatggttttt aacccgagcg 
agagccacag ctgcatgtta ccgcccttgc 
cccagttcca gggtgcgtcc ggctcagacc 
aaatcttccc tcgtttgcat ctccctgacg 
ctcctttccg gaaacccttg gggtgtgctg 
ctgacactgt ggtcgacccc agggcccagc 
tgaggccaga ggagttttcc caggcgaaaa 
tgccacctgc tcctcccata ttcagcccag 
agctccgagg agctcccgta gagggcctgg 
ccatgcgggg acccttgggt agccgcttga 
tgggccacgg gccgtttcca aacacagagt 
ccctcgaggc aggagtggga gaacggagag 
cagcgggcga ggctgtggtg gtccacgcgg 
tggggctcgg ccttcctggc ccgtgctggc 
cccgacctct agcaggtggc tatttctccc 
tgtttccctc ctgggtcagg agcgtggccg 
atttgtttaa aaacattctg ggcctggcct 
cacctcagca gagttactga gaggctgaaa 
aggtcattcc agaagtggct caggaagcca 
gcgggtgaga tgaggtacac ggggggccca 
ctcaggcact gggtgagatg aggtacacgg 
acgggggccc tgatcacacg cacatatgag 
ccaggcctgt gcacacctgc cccaaagtcc 
gacagggccg gcgcggtggc tcacacctgt 
aggatccctt gagcccagga gtttaagacc 
tatgaaaaat aaaaacaaaa attagctgaa 
ttgggaggct gaagtgggag gatcacttga 
gattgcacca ctgcactgca gcctgggtga 
agaagactga caaatgcagt ttcttggaaa 
cagaagccaa gtcggtgtct cggtgtcagt 
ccccagaccc agggtttatg caccacaggg 
ttgatatacg atgacatcaa ggttgtctga 
tggtacacaa ggaacaatgg ataaactgga 
aatcagaagc cagcacgggg ggctggcatc 
gtgttcatac agatggtgca cagaaacgca 
actcgcacac acaagcacac acacagacat 
gcccatgagg aaacccatgc atgtgcattc 
gcccacaccc acgagcaccg tctgattagg 
tcccag 



tggaacgttc cctgtcctgg ctggtcaggg 540 
cacagaggga agggccaatc tgtggaggcc 600 
aggtggtggc acaagccccg gggctgtacc 660 
ccccacctca acaggcctcc cgagccactg 720 
gccccatgag ggctgagaag gagtgcgagc 780 
aattaccgtg cacacttgat gtgaaatgag 840 
gctcacggga gagccttcca ttacaaggtc 900 
cttgcgcctt catgctctgg cagggagggc 960 
accagctcca gaggcttggg accaggctgt 102 0 
gccctcctct ctgccttctc tccctgcctc 1080 
cgtgcctggg ccctcgtgca agccgcttga 1140 
gacacaggtg ccaccgagga ctggaggtgt 1200 
tggcgtgctt ggggcctcct tgggccatga 1260 
ctcctgggaa actcccaggg ccatgtgacc 1320 
tcttgtcctc atttccccac cagggtctct 1380 
gctcagggca gggcggctga gtttccccac 1440 
ttgggtagcc ctgaggaggc cgagatgcga 1500 
caggcacgtg gaaggcccag gaatcccctt 1560 
ctgggccccg atttcacggc agccaggctg 1620 
cgctgggggc ggggtctgat tcaaatccgc 1680 
cgcgcctcca cacgggcttg gggtggacgc 1740 
tttggaagag agcccctcac ccatgctagg 1800 
tgtggcaacc ccgggacctt aggcctattt 1860 
ccgttgttgc^ taaatgggga aaagacatcc 1920 
ccggggtgct ggcctgactg gtgtgatctc 1980 
gtgagaccag gcacatgggg ggctcaggca 2040 
ggcagtgggt gaggccaggt acatgggggg 2100 
ggggctcagg cagagggtca gaccaggtac 2160 
cacatgtgca catgtgctgt ttcatggtag 2220 
caggaagctg agaggccaaa gatggaggct 2280 
agtcccagca ctttgggagg ccgaggcgag 2340 
agcctgagca acatagtaga accccatctc 2400 
catggtggtg tgcgcctgta gttccaatac 2460 
gcccaggagg tggaagctgc agtgagctga 2520 
cagagtgaga gcccatctca acaacaacaa 2580 
gaaacattca gtaggaactt aacctacaca 2640 
gagatgagat gatgggtcct cacaccatca 2700 
gcgggcggct cagaagggat gcgcaggacg 2760 
cgaagggcag gattcatgat aagtacctgc 2820 
aaccttagag gccttcccgg aacaggggct 2880 
caggacggag ctgcttcagc ctccacatgc 2 94 0 
gtgtacctgt gcacacacag acacgcagct 3000 
gcatgcatgc atccgtgtgt gtgcacctgt 3 060 
atgcacgcac acaggcaccg gtgggcccat 3120 
aggcctttcc tctgacgctg tccgccatcc 3180 

3186 



<210> 18 
<211> 781 
<212> DMA 

<213> Homo sapiens 



<400> 18 

gtatgtgcag gtgcctggcc tcagtggcag 
ggagaccgag tgaatctggg cttaggaagt 
taacccaacc accgtcaggc tcgtctgccc 
tggaagggac aggagctgtc tgggagctgc 
gcgctggggg gcctggtctc tcctgtttgc 
tcctgtttgc cctgtggtgg gattgggctg 
gcaaacccag gccaagggct taggaggagg 
agcagaggcc gcgtatcacc acgacagagc 
tcctctgccc ctggacactt tgtccagcat 
agccatgtcg aacctgcggt cctgagctta 



cagtgcctgc ctgctggtgt tagtgtgtca 60 
tcttacccct tttcgcatca ggaagtggtt 120 
gccctctcgt ggggtgagca gagcacctga 180 
catccttccc accttgctct gcctggggaa 240 
cccatggtgg gatttggggg gcctggcctc 300 
tctcccgtcc atggcactta gggcccttgt 360 
ccaggcccag gctaccccac ccctctcagg 420 
cccgcgccgt cctctgcttc ccagtcaccg 480 
cagggaggtt tctgatccgt ctgaaattca 54 0 
acagcttcta ctttctgttc tttctgtgtt 600 
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gtggaaattt cacctggaga agccgaagaa 
gggtcgggac agccagagat ggagccaccc 
gtgcctcccg ggaggggagc tgggctgggc 
9 



aacacttctg tcgtgactcc tgcggtgctc 660 
cgcagaccgt cgggtgtggg cagctttccg 720 
ctgtgactcc tcagcctctg ttttccccca 780 

781 



<210> 19 

<211> 536 

<212> DNA 

<213> Homo sapiens 



<400> 19 

gcaagtgcgg gtggaggcca gtgcgggccc 

cgtgtggggc gagcagcctc agatgctgct 

ggggcctgga gccacgctgg cagccctatg 

agcccggcag ggcccccaac ttcttgaacc 

ccacgcttgg gagccttctg acccctgacc 

ccgccctgag ctcctggggt cctgagcaag 

ctgggctgcc tgtctgctcg ccccggtgga 

ccagccaggg ccacgaggtg caggccctgc 

ttggaggatg ccacctctgg cctcctctgg 



cacctgccca ggggtcatcc ttgaacgccc 60 
gaagtgcaga cgcccccggg cctgaccctg 120 
tgactaaacg ctggtgtccc caggccacgg 180 
cctgcttccc atctcagggg cgatggctcc 240 
tgtgtcctct cacagcctct tccctggctg 300 
ttctctcccc gccccgccgc tccagcgtca 3 60 
ggggtgcctg tcccttcact gaggttccca 420 
ctgcccggcc acccacacgt cccaggaggg 4 80 
aacggagtct gattttggcc ccgcag 536 



<210> 20 

<211> 3179 

<212> DNA 

<213> Homo sapiens 



<400> 20 

atctcatgtt tgaatcctaa cgtgcactgc 
ctgtgagtga acggggtggt ggtcagtgcg 
gtctatgagt gaatggggtt gtggtcagtg 
tttctgatgc tgtgaggcag gaggggaagg 
ccccggaaga cataacagta agtccaggcc 
cttgggcggc ggggatgatg gagggcctgg 
ctggggtggc aggggtgatg gggggggctg 
ggccgggccc cctcctcccc tgcctcccac 
ggcgcacatc ctctgggcca tcagctttca 
cctgtacaaa atccaggatt cccccccctg 
ccgcctccgg ccattctctt aagagcagac 
gcggggcagc ggagggtgtg gacacaggag 
atcctcttat catctcccag tctcatctct 
tcttcctctt atctcccagt ctcatctgtc 
tatcctctta tctcctagtc ccatccagac 
gtggagctgg acatacgtcc ttcctcaggc 
gaggggcggc tcagagggac gcagtcttgg 
gctcgggcca cacgaaaccg agggccctgc 
cctggtgggg ccttatggta tggccgggtc 
gtttgagtgc agcccggacg tgcctggtgt 
gcgtcattta ttgctgcegc ttcagagaat 
gggcccaagt ccacagaccg tgtcgtaaat 
agctgtgagg aaggaggggc tcttggcagc 
ggaagggagc ggccccgggc gccgtgggcg 
agggcgggga cttcccagga gcagaggccg 
gaccaacagg tcaggccatt gttcagctat 
tccccgggtg ttttttgttg aaattttact 
tagaccctta aaaaaggtat ttgctttgat 
ttgtctgttt ttatttatta ttactattac 
ggttgttagt gcagtggcac agtcatggct 
gatcctccgg cctcagcttc ccagagtgct 
ctggcacttt taaaaaccac tatgtaaggt 
cagtagtttg ggaagccgag gcagaaggac 
gggtaacata gggagacccc atctctacaa 
ccagcacccg tagtcccagc tgctcgggag 
ggtcatggct gcagtgagct gtgattgtac 
gaccctgtct caaaaaaaaa aaaaaaaaaa 
gaaggaaaga gaagaagaag gaagaaggaa 



atagacacca ctgtatgcaa ttacagaagc 60 
ggcccatggc ctggctgtgc atttacggaa 120 
cgggcccatg gcccggctgg gcctgggagg 180 
agggtagggg atagacagtg ggagccccca 24 0 
cgaagggcag cagggacgct gggggcccag 3 00 
ccagggcggc agggacgatg ggggccccag 360 
gtctgggtgg cggggaagat ggggaagccc 420 
ctgcagccgt ggatccggat gtgcttccct 4 80 
tggaggtggg gggcaggggc atgacaccat 540 
aacgccccaa ctcaggttga aagtcacatt 600 
caggattctg atctctgaag ggtgggtagg 660 
gcttcagggt ggggctggtg atgctctctc 720 
catcctctta tcatctccca gtctcatctg 780 
atcctcttac catctcccag tctcatctct 840 
ttacctccca gggcgggtgc caggctcgca 900 
agaaggaact ggaaggattg cagagaacag 960 
ggtgaagaaa cagcccctcc tcagaagttg 1020 
gtgagtggct ccagagcctt ccagcaggtc 10B0 
ctactgagtg caccttggac agggcttctg 114 0 
cggggtgggg gcttatggcc actggatatg 1200 
gtctgagtga ccgagcctaa tgtgtatggt 1260 
gcactctggt gcctggagcc cccgcatagg 132 0 
cggcctgggg gcgcctttgc cctgcaaact 1380 
gacgacctca agtgagaggt tggacagaac 144 0 
ctgctcaggc acacctgggt ttgaatcaca 1500 
ccatcttcta caaagctcca gattcctgtt 1560 
caggattact tatatttttt gctaaagtat 1620 
atggcttaac tcactaagca cctactttat 1680 
tattagagat ggtgtctact ctgtcaccca 1740 
cgccgtagcc gcaaaccccc aggctcaagt 1800 
gggattacag gcgtgagcca ctgcccttgc 1860 
caggtccagt ggcttccaca cctgtcatcc 1920 
tgtctgaggc caggagtttg agaccagcat 1980 
aaaatgcaaa aagttatccg ggcgtggggt 2040 
gctgagtggg aggatcgctt gagcccggga 2100 
catcgcactc cagcctgggc aacagagtga 2160 
gaaggagaag gagaagagaa gaagaaggaa 2220 
gaaagaagga gaaggaggcc tgccaggtgc 2280 
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taggtagact gtcaaatctc agagcaaaat 
aaccccagcc ctttggactt ccttaggcct 
gacaagcgtg tatggagcga gtgagttcaa 
ggaggctgtg ggtgacacca gccaggaccc 
gccccacgct cctgccggtc ccgcacctgc 
acctgggaag gatgctgtgc agggggcttg 
gcacttgtgg caggcacaat tacagcccct 
acctgtgaac gtgtcacccg caaggcagag 
cgccagtcag ccgatcttaa ggtcatcctg 
gggtccccag aagtgagaga gggaggcagg 
cactggccac tgccggcttt gagatggagg 
ccgctccacg ctggaaaagc aagcaatcct 
acgcctcgat ttcaggccag tgggacctgt 
tgatgcgttt gtgttcagcc actaagctgc 
cagtacaggg aaatgaatac agggacagtt 



gaaaataaca aagtcttaaa gggaaagaaa 2340 
gaacttcatc tcaagcagct tccttccaca 2400 
agcagaaagg gaggagaagc aggcaagggt 2460 
ctgaaaggga gtggttgttt tcctgcctca 2520 
tgtaaccgtc gatgttggtg ccaggtgccc 2580 
ccaaactttg gtgggtttca gaagccccag 264 0 
ccccaaagat gcccacgtcc ttctcctgga 2700 
gctggtgaag gctgcaggtg gaatcacggc 2760 
gattatctgg tgggccegat atggccacaa 2820 
ggagagtcag agaggggacg tgagaaggac 2880 
agggggcccc cagccaagga atgggggcag 2940 
ccccggtcct gagggcacac ggccctgccc 3000 
ttcagctttc cggcctccag agctgtaaga 3060 
agtgattcgt cacagcagca aatggaatag 3120 
cccagagtga ctctcagccc acccctggg 3179 



